WEBVTT

00:00:02.000 --> 00:00:05.040
>> Olá a todos, e bem-vindos de volta para

00:00:05.040 --> 00:00:07.890
Introdução de desenvolvedores
para a Data Science.

00:00:07.890 --> 00:00:10.560
Aprendizado de máquina de ciência de dados e IA,

00:00:10.560 --> 00:00:14.250
são todos críticos, mas como pode
você começa com eles?

00:00:14.250 --> 00:00:16.110
Neste vídeo, vamos aprender

00:00:16.110 --> 00:00:18.660
qual é o ciclo de vida da ciência de dados.

00:00:18.660 --> 00:00:22.560
O ciclo de vida é projetado para
projetos de ciência de dados que são

00:00:22.560 --> 00:00:27.480
destina-se a moldar como parte de
suas aplicações inteligentes.

00:00:27.480 --> 00:00:30.150
O ciclo de vida da ciência de dados é

00:00:30.150 --> 00:00:32.850
composta de cinco grandes
estágios que são;

00:00:32.850 --> 00:00:36.540
compreensão empresarial, dados
aquisição e compreensão,

00:00:36.540 --> 00:00:40.110
modelagem, implantação,
e aceitação do cliente.

00:00:40.110 --> 00:00:43.245
Vamos começar com
compreensão empresarial.

00:00:43.245 --> 00:00:46.035
Aqui há dois objetivos principais.

00:00:46.035 --> 00:00:49.310
O primeiro é sobre
definindo os objetivos.

00:00:49.310 --> 00:00:50.570
Você precisa trabalhar com

00:00:50.570 --> 00:00:53.540
seus clientes e outros
stakeholders para entender,

00:00:53.540 --> 00:00:55.625
identificar os problemas de negócios.

00:00:55.625 --> 00:00:59.610
O segundo objetivo é sobre
identificando fontes de dados.

00:00:59.610 --> 00:01:02.600
Você precisa encontrar o relevante
dados que ajudam você a responder

00:01:02.600 --> 00:01:04.310
a questão que define

00:01:04.310 --> 00:01:07.310
o objetivo de sua
projeto de ciência de dados.

00:01:07.310 --> 00:01:11.030
Depois disso, temos dados
aquisição e compreensão.

00:01:11.030 --> 00:01:15.800
Os objetivos aqui são produzir
um conjunto de dados limpo e de alta qualidade,

00:01:15.800 --> 00:01:18.425
e desenvolver um
arquitetura de solução de

00:01:18.425 --> 00:01:22.375
o pipeline de dados que
atualiza e pontua seus dados.

00:01:22.375 --> 00:01:24.090
Há três passos principais,

00:01:24.090 --> 00:01:26.280
como você pode ver. Ingerir os dados.

00:01:26.280 --> 00:01:28.310
Aqui você precisa
ingerir seus dados em

00:01:28.310 --> 00:01:31.535
o ambiente analítico alvo
que você vai usar,

00:01:31.535 --> 00:01:34.460
então você precisa explorar
os dados para determinar se

00:01:34.460 --> 00:01:37.340
a qualidade dos dados é boa
o suficiente para responder à pergunta,

00:01:37.340 --> 00:01:39.230
e, finalmente, você precisa configurar

00:01:39.230 --> 00:01:43.055
um pipeline de dados para marcar
dados novos e atualizados.

00:01:43.055 --> 00:01:46.275
Depois disso, há
a fase de modelagem.

00:01:46.275 --> 00:01:50.250
Aqui o objetivo principal é
engenharia de recursos,

00:01:50.250 --> 00:01:52.550
você precisa criar o
recursos de dados de

00:01:52.550 --> 00:01:55.250
os dados brutos para facilitar
o treinamento modelo.

00:01:55.250 --> 00:01:58.190
Treinamento de modelo, você precisa
para encontrar o modelo que

00:01:58.190 --> 00:02:01.390
responder a pergunta em
uma maneira muito precisa,

00:02:01.390 --> 00:02:03.395
e também você precisa comparar

00:02:03.395 --> 00:02:05.780
diferentes métricas de sucesso, a fim de

00:02:05.780 --> 00:02:08.420
entender o que é o melhor
modelo para sua solução,

00:02:08.420 --> 00:02:10.520
e, finalmente, você precisa determinar se

00:02:10.520 --> 00:02:13.190
seu modelo é adequado
para a produção,

00:02:13.190 --> 00:02:15.950
está pronto para ser implantado.

00:02:15.950 --> 00:02:19.470
Finalmente, há implantação.

00:02:19.470 --> 00:02:22.880
Aqui precisamos implantar o
modelo eo pipeline para

00:02:22.880 --> 00:02:26.360
um ambiente de produção de
consumo de aplicativos.

00:02:26.360 --> 00:02:27.860
Para implantar seus modelos,

00:02:27.860 --> 00:02:31.775
você precisa expô-los
com uma interface API aberta.

00:02:31.775 --> 00:02:34.505
A interface permite que o modelo seja

00:02:34.505 --> 00:02:37.670
facilmente consumido de diferentes
tipos de aplicações.

00:02:37.670 --> 00:02:41.250
Algum exemplo destes
aplicativo são site on-line,

00:02:41.250 --> 00:02:45.425
planilha, painel de instrumentos,
aplicações back-end.

00:02:45.425 --> 00:02:50.405
Depois disso, você precisa finalizar
seus dispositivos de entrega de projeto.

00:02:50.405 --> 00:02:53.480
Você precisa confirmar que
o pipeline, o modelo,

00:02:53.480 --> 00:02:56.925
e sua implantação em um
ambiente de produção para satisfazer,

00:02:56.925 --> 00:03:01.345
claro, também seus clientes
ou objetivos das partes interessadas.

00:03:01.345 --> 00:03:03.800
Você pode aprender mais sobre

00:03:03.800 --> 00:03:08.610
o ciclo de vida da ciência de dados em
aka.ms/datasciencelifecycle.

