WEBVTT

00:00:00.000 --> 00:00:02.610
>> É finalmente hora de
brincar com nossos dados.

00:00:02.610 --> 00:00:04.830
Eu tenho um arquivo CSV local com todos os

00:00:04.830 --> 00:00:08.235
meus dados e eu preciso ter certeza
que isso se levanta na Nuvem.

00:00:08.235 --> 00:00:10.740
Além disso, eu preciso
para preparar meus dados.

00:00:10.740 --> 00:00:12.750
Eu sei que o que eu quero fazer é

00:00:12.750 --> 00:00:15.865
prever quantas bicicletas vão
ser alugado em um determinado dia.

00:00:15.865 --> 00:00:19.770
O que significa que eu preciso preparar o meu
dados para previsões de uma série temporal.

00:00:19.770 --> 00:00:22.790
Como sempre, há
documentação adicional sobre

00:00:22.790 --> 00:00:26.350
a tela e, em seguida, uma descrição
lá embaixo. Vamos começar.

00:00:26.350 --> 00:00:30.750
Primeiro, preciso ter certeza.
meu conjunto de dados é acessível.

00:00:31.600 --> 00:00:33.980
Vou adicioná-lo.
para a mesma pasta

00:00:33.980 --> 00:00:36.420
que meu caderno Jupyter está dentro.

00:00:36.880 --> 00:00:40.174
Vou carregar este conjunto de dados

00:00:40.174 --> 00:00:42.955
ao meu Aprendizado de Máquina
Datastore no Azure.

00:00:42.955 --> 00:00:45.355
Vou pegar meu arquivo CSV,

00:00:45.355 --> 00:00:47.825
carregá-lo para a pasta de conjunto de dados,

00:00:47.825 --> 00:00:50.900
substituir quaisquer dados
que já existe,

00:00:50.900 --> 00:00:53.000
e eu quero mostrar o progresso de

00:00:53.000 --> 00:00:56.045
esse processo dentro
Visual Studio Code.

00:00:56.045 --> 00:00:58.640
Ótimo, parece que funcionou.

00:00:58.640 --> 00:01:03.010
Em seguida, eu preciso criar
um objeto de conjunto de dados,

00:01:03.010 --> 00:01:06.910
que é uma classe de
azureml-core e eu preciso

00:01:06.910 --> 00:01:08.935
formação minha data em um
maneira que eu vou fazê-lo

00:01:08.935 --> 00:01:11.755
mais fácil para mim classificar meus dados.

00:01:11.755 --> 00:01:15.050
Preciso importar algumas aulas.

00:01:15.250 --> 00:01:18.220
Agora eu preciso descobrir
qual coluna eu estou indo

00:01:18.220 --> 00:01:21.295
para usar para prever qual outra coluna.

00:01:21.295 --> 00:01:22.855
Antes que eu decida isso,

00:01:22.855 --> 00:01:25.210
Vou abrir o arquivo CSV

00:01:25.210 --> 00:01:27.970
e dar uma olhada
os dados que eu tenho.

00:01:27.970 --> 00:01:30.685
Eu notei que aqui eu tenho data,

00:01:30.685 --> 00:01:34.540
temporada, ano, mês,
que dia da semana,

00:01:34.540 --> 00:01:37.870
o que o tempo é, o
temperatura, a umidade,

00:01:37.870 --> 00:01:41.160
a velocidade do vento, e
Eu também tenho contagem,

00:01:41.160 --> 00:01:43.805
que é o número de bicicletas
que foram alugados.

00:01:43.805 --> 00:01:49.650
Eu acho que o que eu vou fazer é
usar data para prever a contagem.

00:01:50.000 --> 00:01:52.710
Vamos definir isso aqui.

00:01:52.710 --> 00:01:55.010
Agora eu tenho o nome da minha coluna do tempo,

00:01:55.010 --> 00:01:58.520
que será usado para prever
meu nome de coluna alvo.

00:01:58.520 --> 00:02:00.890
Em seguida, eu vou criar

00:02:00.890 --> 00:02:03.650
uma variável local chamada
conjunto de dados que vai manter

00:02:03.650 --> 00:02:05.570
rastro dos meus dados e eu vou

00:02:05.570 --> 00:02:08.360
converter esse conjunto de dados
em um Pandas DataFrame.

00:02:08.360 --> 00:02:11.060
Note que estou ligando para o Take 5,

00:02:11.060 --> 00:02:14.630
que vai imprimir o primeiro
cinco linhas deste dataframe.

00:02:14.630 --> 00:02:17.150
Podemos verificar que
essas linhas estão corretas.

00:02:17.150 --> 00:02:19.920
É 1º de janeiro de 2011,

00:02:19.920 --> 00:02:23.605
a temperatura foi de 0,344167

00:02:23.605 --> 00:02:24.920
e podemos dar uma olhada

00:02:24.920 --> 00:02:28.200
nosso arquivo CSV e ver que
ainda era 1º de janeiro,

00:02:28.200 --> 00:02:36.440
2011, e que o tempo foi
ou a temperatura foi de 0,33344167.

00:02:36.440 --> 00:02:39.620
Isso parece certo. Agora nós
ter um link entre nossos dados

00:02:39.620 --> 00:02:43.890
armazenado em Azure e nosso local
Ambiente Visual Studio Code.

