WEBVTT

00:00:00.000 --> 00:00:02.610
>> E 'finalmente il momento di
giocare con i nostri dati.

00:00:02.610 --> 00:00:04.830
Ho un file CSV locale con tutti

00:00:04.830 --> 00:00:08.235
i miei dati e ho bisogno di assicurarsi
che questo si alza nel Cloud.

00:00:08.235 --> 00:00:10.740
Inoltre, ho bisogno di
per preparare i miei dati.

00:00:10.740 --> 00:00:12.750
So che quello che voglio fare è

00:00:12.750 --> 00:00:15.865
prevedere quante biciclette
essere affittati in un determinato giorno.

00:00:15.865 --> 00:00:19.770
Il che significa che ho bisogno di preparare il mio
per le previsioni di una serie temporale.

00:00:19.770 --> 00:00:22.790
Come sempre, c'è
documentazione aggiuntiva su

00:00:22.790 --> 00:00:26.350
lo schermo e poi una descrizione
in basso. Iniziamo.

00:00:26.350 --> 00:00:30.750
In primo luogo, ho bisogno di fare in modo
il mio set di dati è accessibile.

00:00:31.600 --> 00:00:33.980
Ho intenzione di aggiungerlo
nella stessa cartella

00:00:33.980 --> 00:00:36.420
che il mio taccuino Jupyter è in

00:00:36.880 --> 00:00:40.174
Ho intenzione di caricare questo set di dati

00:00:40.174 --> 00:00:42.955
al mio Machine Learning
Archivio dati in Azure.Datastore up on Azure.

00:00:42.955 --> 00:00:45.355
Prendo il mio file CSV,

00:00:45.355 --> 00:00:47.825
caricarlo nella cartella del set di dati,

00:00:47.825 --> 00:00:50.900
sovrascrivere tutti i dati
che esiste già,

00:00:50.900 --> 00:00:53.000
e voglio mostrare il progresso di

00:00:53.000 --> 00:00:56.045
questo processo all'interno
Codice di Visual Studio.

00:00:56.045 --> 00:00:58.640
Fantastico, sembra che abbia funzionato.

00:00:58.640 --> 00:01:03.010
Successivamente, ho bisogno di creare
un oggetto dataset,

00:01:03.010 --> 00:01:06.910
che è una classe di
azureml-core e ho bisogno di

00:01:06.910 --> 00:01:08.935
formattare la mia data in un
modo che farò

00:01:08.935 --> 00:01:11.755
più facile per me ordinare i miei dati.

00:01:11.755 --> 00:01:15.050
Devo importare delle lezioni.

00:01:15.250 --> 00:01:18.220
Ora ho bisogno di capire
quale colonna sto andando

00:01:18.220 --> 00:01:21.295
da utilizzare per prevedere quale altra colonna.

00:01:21.295 --> 00:01:22.855
Prima di decidere questo,

00:01:22.855 --> 00:01:25.210
Ho intenzione di aprire il file CSV

00:01:25.210 --> 00:01:27.970
e dare un'occhiata a
i dati che ho.

00:01:27.970 --> 00:01:30.685
Ho notato che qui ho una data,

00:01:30.685 --> 00:01:34.540
stagione, anno, mese,
quale giorno della settimana,

00:01:34.540 --> 00:01:37.870
qual è il tempo, il
temperatura, l'umidità,

00:01:37.870 --> 00:01:41.160
la velocità del vento, e
Ho anche il conteggio,

00:01:41.160 --> 00:01:43.805
che è il numero di biciclette
che sono stati affittati.

00:01:43.805 --> 00:01:49.650
Penso che quello che farò è
utilizzare date per prevedere il conteggio.

00:01:50.000 --> 00:01:52.710
Definiamolo qui.

00:01:52.710 --> 00:01:55.010
Ora ho il mio nome di colonna temporale,

00:01:55.010 --> 00:01:58.520
che sarà utilizzato per prevedere
il nome della colonna di destinazione.

00:01:58.520 --> 00:02:00.890
Successivamente, ho intenzione di creare

00:02:00.890 --> 00:02:03.650
una variabile locale chiamata
set di dati che manterrà

00:02:03.650 --> 00:02:05.570
traccia dei miei dati e ho intenzione di

00:02:05.570 --> 00:02:08.360
convertire tale set di dati
in un frame di dati Pandas.

00:02:08.360 --> 00:02:11.060
Si noti che sto chiamando prendere 5,

00:02:11.060 --> 00:02:14.630
che stamperà il primo
cinque righe di questo frame di dati.

00:02:14.630 --> 00:02:17.150
Possiamo verificare che
queste righe sono corrette.

00:02:17.150 --> 00:02:19.920
È il 1 gennaio 2011,

00:02:19.920 --> 00:02:23.605
la temperatura era 0,344167

00:02:23.605 --> 00:02:24.920
e possiamo dare un'occhiata a

00:02:24.920 --> 00:02:28.200
il nostro file CSV e vedere che
era ancora il 1 gennaio,

00:02:28.200 --> 00:02:36.440
2011, e che il tempo era
o la temperatura era 0.33344167.

00:02:36.440 --> 00:02:39.620
Sta andando bene. Ora
hanno un collegamento tra i nostri dati

00:02:39.620 --> 00:02:43.890
archiviate in Azure e nei nostri
Ambiente di visual Studio Code.

