WEBVTT

00:00:03.200 --> 00:00:08.100
>> Bem-vindo de volta para os desenvolvedores
introdução à ciência de dados.

00:00:08.100 --> 00:00:12.510
Uma pergunta comum mostra que
muitos clientes, desenvolvedores,

00:00:12.510 --> 00:00:15.030
mas também os cientistas de dados me perguntam é:

00:00:15.030 --> 00:00:18.690
que aprendizado de máquina
algoritmo devo usar?

00:00:18.690 --> 00:00:24.465
Eu sempre respondo, depende
em muitos fatores diferentes.

00:00:24.465 --> 00:00:27.300
Mas o mais importante, o
algoritmo que você selecionar depende

00:00:27.300 --> 00:00:30.750
em um aspecto do seu
cenário de ciência de dados.

00:00:30.750 --> 00:00:32.880
O que você quer
fazer com seus dados?

00:00:32.880 --> 00:00:36.515
Esta é a pergunta mais importante
que você deve se perguntar.

00:00:36.515 --> 00:00:39.200
Especificamente, outro
a questão importante é:

00:00:39.200 --> 00:00:41.870
qual é o negócio
perguntas que você quer

00:00:41.870 --> 00:00:45.305
resposta por aprendizado
de seus dados passados?

00:00:45.305 --> 00:00:48.679
Aprendizado de máquina tem muitos
algoritmos diferentes,

00:00:48.679 --> 00:00:51.740
e cada algoritmo diferente
pode ajudá-lo a alcançar

00:00:51.740 --> 00:00:55.200
um objetivo diferente e resposta
uma pergunta diferente.

00:00:55.200 --> 00:00:57.615
Vamos ver alguns desses.

00:00:57.615 --> 00:01:01.755
O primeiro é prever
entre diferentes categorias.

00:01:01.755 --> 00:01:04.940
Aqui temos dois diferentes
tipos de métodos,

00:01:04.940 --> 00:01:07.160
e nós temos o de duas classes
Classificação

00:01:07.160 --> 00:01:08.960
que é ótimo em responder

00:01:08.960 --> 00:01:12.315
pergunta que são
perguntas de duas escolhas,

00:01:12.315 --> 00:01:15.150
Como sim ou não, verdadeiro ou falso.

00:01:15.150 --> 00:01:18.545
Então nós temos o
classificação multiclasse,

00:01:18.545 --> 00:01:21.110
que é ótimo em responder
questões complexas

00:01:21.110 --> 00:01:24.355
com várias opções possíveis.

00:01:24.355 --> 00:01:27.560
Você também pode usar a máquina
aprendendo sobre seus dados para

00:01:27.560 --> 00:01:30.405
descobrir parceiros em seus dados.

00:01:30.405 --> 00:01:32.450
Aqui temos três tipos diferentes de

00:01:32.450 --> 00:01:34.805
método, como um recomendadores,

00:01:34.805 --> 00:01:37.400
que são ótimos em prever o que

00:01:37.400 --> 00:01:40.220
alguém vai estar interessado
em, no futuro.

00:01:40.220 --> 00:01:46.085
Clustering é ótimo em separar
pontos de dados semelhantes em grupos.

00:01:46.085 --> 00:01:50.030
Finalmente, detecção de anomalias,
que é ótimo em

00:01:50.030 --> 00:01:55.450
identificando e prevendo
pontos de dados raros ou incomuns.

00:01:55.450 --> 00:01:58.715
Outra coisa que você pode fazer
com seus dados é realmente

00:01:58.715 --> 00:02:02.405
entendendo o que
imagem está apresentando,

00:02:02.405 --> 00:02:05.045
e também compreensão
a linguagem natural.

00:02:05.045 --> 00:02:08.960
Aqui temos métodos como
como classificação de imagem,

00:02:08.960 --> 00:02:13.130
que é capaz de identificar
imagem com redes neurais.

00:02:13.130 --> 00:02:16.325
Também análises de texto, que é capaz de

00:02:16.325 --> 00:02:20.660
deriva de alta qualidade
informações do texto.

00:02:20.660 --> 00:02:23.150
Finalmente, se você precisa prever

00:02:23.150 --> 00:02:26.285
os resultados com base no
relação entre os valores,

00:02:26.285 --> 00:02:29.930
você pode usar um diferente
tipo de método de regressão.

00:02:29.930 --> 00:02:34.310
Com regressão, você está
geralmente fazendo previsão por

00:02:34.310 --> 00:02:39.580
estimando a relação
entre seus valores.

00:02:39.580 --> 00:02:44.715
Para este caso de uso específico
que Sara está tentando resolver,

00:02:44.715 --> 00:02:46.980
Acho que precisamos prever

00:02:46.980 --> 00:02:50.395
quantas bicicletas serão
alugado na próxima hora.

00:02:50.395 --> 00:02:53.660
Eu realmente acho que o
previsão, mais importante,

00:02:53.660 --> 00:02:58.460
regressão é o método certo
que devemos usar, porque nós

00:02:58.460 --> 00:03:00.620
realmente quero prever um resultado

00:03:00.620 --> 00:03:04.290
com base na relação
entre os valores.

