WEBVTT

00:00:02.180 --> 00:00:07.505
>> Bem-vindo de volta para os desenvolvedores
introdução à Ciência de Dados.

00:00:07.505 --> 00:00:10.390
Agora, vamos aprender mais
sobre como você pode escolher

00:00:10.390 --> 00:00:11.680
o melhor modelo para

00:00:11.680 --> 00:00:15.100
seu cenário de ciência de dados com
o aprendizado de máquina automatizado.

00:00:15.100 --> 00:00:17.800
Entendendo o
poder preditivo de um conjunto

00:00:17.800 --> 00:00:20.420
de características com respeito
a uma variável dependente,

00:00:20.420 --> 00:00:21.970
é um problema muito complicado,

00:00:21.970 --> 00:00:23.770
e que não há métrica universal

00:00:23.770 --> 00:00:26.155
que pode dizer como fazer isso.

00:00:26.155 --> 00:00:28.120
Então a resposta para a pergunta,

00:00:28.120 --> 00:00:31.180
qual algoritmo eu deveria
uso é sempre, depende.

00:00:31.180 --> 00:00:33.400
Depende do tamanho, da qualidade,

00:00:33.400 --> 00:00:35.170
e a natureza de seus dados,

00:00:35.170 --> 00:00:39.205
depende do que você quer
fazer com essa resposta específica.

00:00:39.205 --> 00:00:41.650
Finalmente, a resposta para a pergunta,

00:00:41.650 --> 00:00:45.119
quais parâmetros eu deveria usar
também é muito desafiador.

00:00:45.119 --> 00:00:47.090
Como você sabe, hiperparmetros são

00:00:47.090 --> 00:00:50.435
parâmetros de nível mais alto
que não pode ser aprendido

00:00:50.435 --> 00:00:53.030
diretamente dos dados usando

00:00:53.030 --> 00:00:56.215
descida gradiente ou outro
algoritmo de otimização.

00:00:56.215 --> 00:00:59.600
Eles descrevem a estrutura
informações sobre um modelo que

00:00:59.600 --> 00:01:03.380
deve ser decidido antes
montagem de parâmetros de modelo.

00:01:03.380 --> 00:01:06.125
Configuração de parâmetros de modelo
e pesquisando antes

00:01:06.125 --> 00:01:08.860
valores de parâmetros ideais com base em

00:01:08.860 --> 00:01:13.065
aprendizado e experiência pode
ser também muito demorado.

00:01:13.065 --> 00:01:16.085
Estimadores diferentes
são mais adequados

00:01:16.085 --> 00:01:19.160
para diferentes tipos de dados
e também problemas diferentes.

00:01:19.160 --> 00:01:22.610
Tantas vezes eu diria que
a parte mais difícil de resolver

00:01:22.610 --> 00:01:24.170
um problema de aprendizado de máquina pode ser

00:01:24.170 --> 00:01:27.175
encontrar o direito
estimador para o seu trabalho.

00:01:27.175 --> 00:01:31.100
É por isso que eu uso muito frequentemente
aprendizado de máquina automatizado,

00:01:31.100 --> 00:01:34.070
que é o processo de
automatizando o tempo que consome

00:01:34.070 --> 00:01:37.295
e tarefa iterativa da máquina
desenvolvimento de modelos de aprendizagem.

00:01:37.295 --> 00:01:41.510
Aprendizado de máquina automatizado
leva em conta a incerteza,

00:01:41.510 --> 00:01:43.940
incorporando sua
modelo probabilístico para

00:01:43.940 --> 00:01:47.090
determinando o melhor
oleoduto para tentar o próximo.

00:01:47.090 --> 00:01:51.350
Esta abordagem permite
aprendizado de máquina automatizado para

00:01:51.350 --> 00:01:55.925
explorar o mais promissor
possibilidades sem perder tempo.

00:01:55.925 --> 00:01:58.080
Agora, vamos dar uma olhada mais de perto

00:01:58.080 --> 00:02:01.790
os diferentes automatizados
capacidades de aprendizagem de máquina.

00:02:01.790 --> 00:02:04.670
Em primeiro lugar, com automatizado
aprendizado de máquina que você precisa

00:02:04.670 --> 00:02:08.255
identificar o aprendizado de máquina
problema que você quer resolver.

00:02:08.255 --> 00:02:11.914
Estes podem ser classificação,
previsão, ou regressão.

00:02:11.914 --> 00:02:14.060
Então você tem que especificar a fonte

00:02:14.060 --> 00:02:16.600
e o formato do
dados de treinamento rotulados.

00:02:16.600 --> 00:02:20.420
Isso vai ser NumPy
matrizes ou um Pandas DataFrame.

00:02:20.420 --> 00:02:22.640
Finalmente, você precisa configurar

00:02:22.640 --> 00:02:25.055
o alvo do computador
para o treinamento de modelos,

00:02:25.055 --> 00:02:27.064
como seu computador local,

00:02:27.064 --> 00:02:30.380
Aprendizado de máquina azul
computação, VM remoto,

00:02:30.380 --> 00:02:32.825
então nossos Dados Azure, por exemplo,

00:02:32.825 --> 00:02:35.240
e durante o treinamento do
Aprendizado de Máquina Azure

00:02:35.240 --> 00:02:37.700
servir basicamente para um número de

00:02:37.700 --> 00:02:42.635
oleodutos imparallel que tentam
algoritmos e parâmetros diferentes.

00:02:42.635 --> 00:02:45.140
Ele só vai parar quando bater

00:02:45.140 --> 00:02:49.345
os critérios de saída que você
definir no experimento.

00:02:49.345 --> 00:02:54.330
A classe AutoMLConfig representa
uma configuração para envio

00:02:54.330 --> 00:02:56.500
um aprendizado de máquina automatizado

00:02:56.500 --> 00:02:59.310
experimento em Aprendizado de Máquina Azure.

00:02:59.310 --> 00:03:02.710
Este objeto de configuração
contém e prossegue para

00:03:02.710 --> 00:03:06.245
os parâmetros para configurar
o experimento ao redor,

00:03:06.245 --> 00:03:10.145
bem como os dados de treinamento que
precisa ser usado no tempo de execução.

00:03:10.145 --> 00:03:14.070
Para saber mais, por favor veja
aka.ms/AutoMLConfig-Class.

