WEBVTT

00:00:00.000 --> 00:00:02.610
"" Je konečně čas
pohrajte si s našimi daty.

00:00:02.610 --> 00:00:04.830
Mám místní soubor CSV se všemi

00:00:04.830 --> 00:00:08.235
moje data a musím se ujistit,
že se dostane do cloudu.

00:00:08.235 --> 00:00:10.740
Kromě toho potřebuji
připravit svá data.

00:00:10.740 --> 00:00:12.750
Vím, že to, co chci udělat, je

00:00:12.750 --> 00:00:15.865
předpovědět, kolik kol bude
být pronajata v určitý den.

00:00:15.865 --> 00:00:19.770
Což znamená, že si musím připravit
data pro prognózy časových řad.

00:00:19.770 --> 00:00:22.790
Jako vždy existuje
další dokumentaci

00:00:22.790 --> 00:00:26.350
obrazovku a poté popis
dole. Začneme.

00:00:26.350 --> 00:00:30.750
Nejprve se musím ujistit, že
moje datová sada je přístupná.

00:00:31.600 --> 00:00:33.980
Přidám to.
do stejné složky

00:00:33.980 --> 00:00:36.420
že můj jupyter notebook je v.

00:00:36.880 --> 00:00:40.174
Chystám se nahrát tuto datovou sadu

00:00:40.174 --> 00:00:42.955
do mého strojového učení
Data se uchová v Azure.

00:00:42.955 --> 00:00:45.355
Vezmu si složku CSV.

00:00:45.355 --> 00:00:47.825
nahrát do složky datové sady,

00:00:47.825 --> 00:00:50.900
přepsat všechna data
který již existuje,

00:00:50.900 --> 00:00:53.000
a chci ukázat pokrok

00:00:53.000 --> 00:00:56.045
tento proces v rámci
Kód sady Visual Studio.

00:00:56.045 --> 00:00:58.640
Super, to vypadá, že to fungovalo.

00:00:58.640 --> 00:01:03.010
Dále potřebuji vytvořit
objekt datové sady,

00:01:03.010 --> 00:01:06.910
což je třída
azureml-core a musím

00:01:06.910 --> 00:01:08.935
zformovat datum v
tak, že budu dělat to

00:01:08.935 --> 00:01:11.755
jednodušší pro mě třídit moje data.

00:01:11.755 --> 00:01:15.050
Musím dovézt nějaké hodiny.

00:01:15.250 --> 00:01:18.220
Teď musím přijít na to,
který sloupec jdu

00:01:18.220 --> 00:01:21.295
použít k předvídání dalšího sloupce.

00:01:21.295 --> 00:01:22.855
Než se rozhodnu,

00:01:22.855 --> 00:01:25.210
Otevřu soubor CSV.

00:01:25.210 --> 00:01:27.970
a podívejte se na
údaje, které mám.

00:01:27.970 --> 00:01:30.685
Všiml jsem si, že tady mám rande.

00:01:30.685 --> 00:01:34.540
sezóna, rok, měsíc,
který den v týdnu,

00:01:34.540 --> 00:01:37.870
jaké je počasí,
teploty, vlhkosti,

00:01:37.870 --> 00:01:41.160
rychlost větru a
Také mám počet,

00:01:41.160 --> 00:01:43.805
což je počet kol
které byly pronajaty.

00:01:43.805 --> 00:01:49.650
Myslím, že to, co udělám, je, že budu
datum použití k předvídání počtu.

00:01:50.000 --> 00:01:52.710
Pojďme to definovat tady.

00:01:52.710 --> 00:01:55.010
Teď mám svůj čas název sloupce,

00:01:55.010 --> 00:01:58.520
které budou použity k předvídání
můj cílový název sloupce.

00:01:58.520 --> 00:02:00.890
Dále vytvořím

00:02:00.890 --> 00:02:03.650
místní proměnná s názvem
datová sada, která bude

00:02:03.650 --> 00:02:05.570
sledování mých dat a budu

00:02:05.570 --> 00:02:08.360
převést tuto datovou sadu
do Pandas DataFrame.

00:02:08.360 --> 00:02:11.060
Všimněte si, že volám vzít 5,

00:02:11.060 --> 00:02:14.630
který vytiskne první
pět řádků tohoto datového rámce.

00:02:14.630 --> 00:02:17.150
Můžeme ověřit, že
tyto řádky jsou správné.

00:02:17.150 --> 00:02:19.920
Je 1.ledna 2011,

00:02:19.920 --> 00:02:23.605
teplota byla 0,344167

00:02:23.605 --> 00:02:24.920
a můžeme se podívat na

00:02:24.920 --> 00:02:28.200
našeho souboru CSV a uvidíte, že
to bylo ještě 1.ledna,

00:02:28.200 --> 00:02:36.440
2011 a že počasí bylo
nebo teplota byla 0,33344167.

00:02:36.440 --> 00:02:39.620
To vypadá dobře. Nyní jsme
mají vazbu mezi našimi údaji

00:02:39.620 --> 00:02:43.890
uložených v Azure a našich místních
Prostředí kódu sady Visual Studio.

