WEBVTT

00:00:00.000 --> 00:00:02.610
>> Nadszedł czas, aby
bawić się z naszymi danymi.

00:00:02.610 --> 00:00:04.830
Mam lokalny plik CSV ze wszystkimi

00:00:04.830 --> 00:00:08.235
moje dane i muszę się upewnić, że
że wstaje do chmury.

00:00:08.235 --> 00:00:10.740
Dodatkowo potrzebuję
w celu przygotowania moich danych.

00:00:10.740 --> 00:00:12.750
Wiem, że to, co chcę zrobić, to

00:00:12.750 --> 00:00:15.865
przewidzieć, ile rowerów
być wynajmowane w określonym dniu.

00:00:15.865 --> 00:00:19.770
Co oznacza, że muszę przygotować
danych dla prognoz szeregów czasowych.

00:00:19.770 --> 00:00:22.790
Jak zawsze, istnieje
dodatkową dokumentację dotyczącą

00:00:22.790 --> 00:00:26.350
na ekranie, a następnie opis
poniżej. Zaczynajmy.

00:00:26.350 --> 00:00:30.750
Po pierwsze, muszę upewnić się, że
mój zestaw danych jest dostępny.

00:00:31.600 --> 00:00:33.980
Dodam go
do tego samego folderu

00:00:33.980 --> 00:00:36.420
że mój notatnik Jupyter jest w.

00:00:36.880 --> 00:00:40.174
Mam zamiar przesłać ten zestaw danych

00:00:40.174 --> 00:00:42.955
do mojego uczenia maszynowego
Magazyn danych na platformie Azure.

00:00:42.955 --> 00:00:45.355
Złapię mój plik CSV,

00:00:45.355 --> 00:00:47.825
prześlij go do folderu zestawu danych,

00:00:47.825 --> 00:00:50.900
zastępowanie dowolnych danych
który już istnieje,

00:00:50.900 --> 00:00:53.000
i chcę pokazać postępy

00:00:53.000 --> 00:00:56.045
ten proces w ciągu
Kod programu Visual Studio.

00:00:56.045 --> 00:00:58.640
Świetnie, że wygląda na to, że pracował.

00:00:58.640 --> 00:01:03.010
Następnie muszę stworzyć
obiekt zestawu danych,

00:01:03.010 --> 00:01:06.910
która jest klasą
azureml-core i muszę

00:01:06.910 --> 00:01:08.935
sformatować datę w
sposób, że zrobię to

00:01:08.935 --> 00:01:11.755
łatwiej mi sortować dane.

00:01:11.755 --> 00:01:15.050
Muszę zaimportować kilka klas.

00:01:15.250 --> 00:01:18.220
Teraz muszę dowiedzieć się
którą kolumnę wybieram

00:01:18.220 --> 00:01:21.295
do przewidywania, która inna kolumna.

00:01:21.295 --> 00:01:22.855
Zanim to zdecyduję,

00:01:22.855 --> 00:01:25.210
Mam zamiar otworzyć plik CSV

00:01:25.210 --> 00:01:27.970
i spójrz na
danych, które posiadam.

00:01:27.970 --> 00:01:30.685
Zauważyłem, że tutaj mam datę,

00:01:30.685 --> 00:01:34.540
sezon, rok, miesiąc,
w którym dniu tygodnia,

00:01:34.540 --> 00:01:37.870
jaka jest pogoda,
temperatura, wilgotność,

00:01:37.870 --> 00:01:41.160
prędkość wiatru, oraz
Ja też liczę,

00:01:41.160 --> 00:01:43.805
czyli liczby rowerów
które zostały wynajęte.

00:01:43.805 --> 00:01:49.650
Myślę, że to, co zrobię, to
użyj daty do przewidywania liczby.

00:01:50.000 --> 00:01:52.710
Zdefiniujmy to tutaj.

00:01:52.710 --> 00:01:55.010
Teraz mam swoją nazwę kolumny czasu,

00:01:55.010 --> 00:01:58.520
które zostaną wykorzystane do przewidywania
moja nazwa kolumny docelowej.

00:01:58.520 --> 00:02:00.890
Następnie zamierzam utworzyć

00:02:00.890 --> 00:02:03.650
zmienna lokalna o nazwie
zestaw danych, który będzie

00:02:03.650 --> 00:02:05.570
śledzenia moich danych i zamierzam

00:02:05.570 --> 00:02:08.360
konwertowanie tego zestawu danych
w Pandas DataFrame.

00:02:08.360 --> 00:02:11.060
Zauważ, że dzwonię take 5,

00:02:11.060 --> 00:02:14.630
który wydrukuje pierwszy
pięć wierszy tej ramki danych.

00:02:14.630 --> 00:02:17.150
Możemy sprawdzić, czy
te wiersze są poprawne.

00:02:17.150 --> 00:02:19.920
Jest 1 stycznia 2011,

00:02:19.920 --> 00:02:23.605
temperatura wynosiła 0,344167

00:02:23.605 --> 00:02:24.920
i możemy przyjrzeć się

00:02:24.920 --> 00:02:28.200
naszego pliku CSV i zobacz, że
to było jeszcze 1 stycznia,

00:02:28.200 --> 00:02:36.440
2011 r., oraz że pogoda była
lub temp wynosiła 0,33344167.

00:02:36.440 --> 00:02:39.620
To wygląda dobrze. Teraz
mieć związek między naszymi danymi

00:02:39.620 --> 00:02:43.890
przechowywane na platformie Azure i naszych
Środowisko kodu programu Visual Studio.

