WEBVTT

00:00:02.870 --> 00:00:07.590
>> Bem-vindo de volta aos Desenvolvedores
Introdução à Ciência de Dados.

00:00:07.590 --> 00:00:09.450
Provavelmente muitos de vocês já estão

00:00:09.450 --> 00:00:12.120
familiarizado com a tradição
lógica de programação.

00:00:12.120 --> 00:00:13.740
Então vamos tentar entender

00:00:13.740 --> 00:00:15.360
o aprendizado de máquina em alavancar

00:00:15.360 --> 00:00:17.220
a lógica de programação da tradição.

00:00:17.220 --> 00:00:18.640
Esta é uma imagem disso,

00:00:18.640 --> 00:00:20.670
que mostra a diferença em como

00:00:20.670 --> 00:00:24.580
programação tradição é criado
contra um modelo de aprendizado de máquina.

00:00:24.580 --> 00:00:28.290
Usos tradicionais de programação
lógica esteticamente programa

00:00:28.290 --> 00:00:30.405
para obter as saídas específicas.

00:00:30.405 --> 00:00:32.780
Os resultados estáticos são gerados com base em

00:00:32.780 --> 00:00:35.075
a lógica do programa no algoritmo.

00:00:35.075 --> 00:00:37.130
Seu aprendizado de máquina
e especificamente

00:00:37.130 --> 00:00:39.290
em um aprendizado de máquina supervisionado,

00:00:39.290 --> 00:00:41.810
você tem seus dados que são

00:00:41.810 --> 00:00:44.090
suas características e, em seguida, você tem

00:00:44.090 --> 00:00:47.005
em saídas que são seus rótulos.

00:00:47.005 --> 00:00:50.720
Isso passa pelo
computação algoritmo

00:00:50.720 --> 00:00:52.820
e o modelo é criado,

00:00:52.820 --> 00:00:55.460
podemos alcançar o básico
função de usuário nível usando

00:00:55.460 --> 00:00:58.580
uma função matemática
criado com os dados.

00:00:58.580 --> 00:01:02.375
Isso é chamado de treinamento seu
modelo de aprendizado de máquina.

00:01:02.375 --> 00:01:06.710
No aprendizado de máquina, há
são duas categorias diferentes,

00:01:06.710 --> 00:01:09.470
um é chamado de aprendizagem supervisionada

00:01:09.470 --> 00:01:12.635
e o outro é
aprendizado não supervisionado.

00:01:12.635 --> 00:01:14.870
Supervisionado significa que estamos dando

00:01:14.870 --> 00:01:17.165
os exemplos de ambos os dados,

00:01:17.165 --> 00:01:19.280
usá-lo para prever e a resposta.

00:01:19.280 --> 00:01:22.070
Por exemplo, é um cachorro ou é um gato.

00:01:22.070 --> 00:01:25.130
Nós vamos dar o
imagem tag modelo de

00:01:25.130 --> 00:01:28.605
uma categoria de recursos para
cães e para gatos.

00:01:28.605 --> 00:01:32.445
Nós contaríamos a ele.
o que é um gato e um cachorro é.

00:01:32.445 --> 00:01:36.600
Então o modelo aprenderia
como marcar dados fornecidos.

00:01:36.600 --> 00:01:40.760
Um aprendizado supervisionado é quando nós
dar-lhe um conjunto de dados não grampeado para

00:01:40.760 --> 00:01:42.635
aprender sem dar-lhe

00:01:42.635 --> 00:01:45.590
a resposta do que
queremos que aprenda.

00:01:45.590 --> 00:01:49.295
Como você pode ver, sob o
aprendizado de máquina supervisionado,

00:01:49.295 --> 00:01:52.460
existem dois métodos:
regressão e classificação.

00:01:52.460 --> 00:01:55.235
Enquanto sob o não supervisionado
aprendizado de máquina,

00:01:55.235 --> 00:01:57.845
há três diferentes
métodos: agrupamento,

00:01:57.845 --> 00:02:00.905
detecção de anomalias,
e recomendação.

00:02:00.905 --> 00:02:02.810
Agora que temos um pouco de

00:02:02.810 --> 00:02:05.210
compreensão do que
aprendizado de máquina é,

00:02:05.210 --> 00:02:08.825
vamos olhar para o modelo
processo de construção em alto nível.

00:02:08.825 --> 00:02:11.540
Como você pode ver, há
são quatro estágios principais.

00:02:11.540 --> 00:02:14.090
Nós dissemos que há um preparo
seus dados, treine seu modelo,

00:02:14.090 --> 00:02:17.600
testar seu modelo, e
operacionalize seu modelo.

00:02:17.600 --> 00:02:18.875
Prepare seus dados,

00:02:18.875 --> 00:02:21.305
e este é um estágio que você precisa encontrar,

00:02:21.305 --> 00:02:22.985
selecionar e criar um dado,

00:02:22.985 --> 00:02:27.620
aplicação de técnicas de pré-processamento
e também preencher lacunas em seus dados.

00:02:27.620 --> 00:02:33.455
O modelo de trem significa que
você tem que dar o seu modelo

00:02:33.455 --> 00:02:36.590
dados específicos para que o seu
modelo vai aprender

00:02:36.590 --> 00:02:40.175
a partir desses dados para prever
como algo no futuro.

00:02:40.175 --> 00:02:43.010
Esta é uma tarefa muito iterativa

00:02:43.010 --> 00:02:45.990
porque você pode precisar
alterar os dados no modelo

00:02:45.990 --> 00:02:48.560
até que você pensa que você tem

00:02:48.560 --> 00:02:52.190
um bom dados contábeis
para a fase de produção.

00:02:52.190 --> 00:02:54.020
Modelo de teste, agora que você tem

00:02:54.020 --> 00:02:57.200
um modelo que você acha que é
indo para o desempenho muito bem,

00:02:57.200 --> 00:02:59.800
você pode testá-lo para
pesar os novos dados.

00:02:59.800 --> 00:03:01.980
Por fim, operacionalize seu modelo.

00:03:01.980 --> 00:03:05.030
Agora é a hora de operacionalizar
seu modelo para que você

00:03:05.030 --> 00:03:09.360
pode consumi-lo a partir de
aplicações diferentes.

