WEBVTT

00:00:00.000 --> 00:00:02.610
終於到了
玩我們的數據。

00:00:02.610 --> 00:00:04.830
我有本地的 CSV 檔與所有

00:00:04.830 --> 00:00:08.235
我的數據, 我需要確保
進入雲。

00:00:08.235 --> 00:00:10.740
此外,我需要
準備我的資料

00:00:10.740 --> 00:00:12.750
我知道我想做的就是

00:00:12.750 --> 00:00:15.865
預測多少自行車將
某天租。

00:00:15.865 --> 00:00:19.770
這意味著我需要準備我的
時間序列預測的數據。

00:00:19.770 --> 00:00:22.790
一如既往,有
有關其他文件

00:00:22.790 --> 00:00:26.350
螢幕, 然後描述
下面。讓我們開始吧。

00:00:26.350 --> 00:00:30.750
首先,我需要確保
我的數據集是可訪問的。

00:00:31.600 --> 00:00:33.980
我要添加它
到同一個資料夾

00:00:33.980 --> 00:00:36.420
我的朱彼特筆記本在

00:00:36.880 --> 00:00:40.174
我要上傳此資料集

00:00:40.174 --> 00:00:42.955
到我的機器學習
數據存儲在 Azure 上。

00:00:42.955 --> 00:00:45.355
我會抓住我的CSV檔案

00:00:45.355 --> 00:00:47.825
將其上傳到數據集資料夾,

00:00:47.825 --> 00:00:50.900
覆寫任何資料
已經存在的

00:00:50.900 --> 00:00:53.000
我想展示的進展

00:00:53.000 --> 00:00:56.045
這個過程內
可視化工作室代碼。

00:00:56.045 --> 00:00:58.640
太好了, 看起來成功了。

00:00:58.640 --> 00:01:03.010
接下來,我需要創建
數據集物件,

00:01:03.010 --> 00:01:06.910
這是一個類
azureml 核心, 我需要

00:01:06.910 --> 00:01:08.935
格式化我的日期在
的方式, 我會使它

00:01:08.935 --> 00:01:11.755
更容易為我的數據排序。

00:01:11.755 --> 00:01:15.050
我需要導入一些類。

00:01:15.250 --> 00:01:18.220
現在我需要弄清楚
我要去哪個列

00:01:18.220 --> 00:01:21.295
用於預測哪個其他列。

00:01:21.295 --> 00:01:22.855
在我決定之前

00:01:22.855 --> 00:01:25.210
我要開啟 Csv 檔案

00:01:25.210 --> 00:01:27.970
看看
我擁有的數據。

00:01:27.970 --> 00:01:30.685
我注意到我這裡有約會

00:01:30.685 --> 00:01:34.540
季節,年,月,
一周中哪一天

00:01:34.540 --> 00:01:37.870
天氣是什麼,
溫度 濕度

00:01:37.870 --> 00:01:41.160
風速,
我也算數,

00:01:41.160 --> 00:01:43.805
這是自行車的數量
已出租。

00:01:43.805 --> 00:01:49.650
我想我要做的就是
使用日期預測計數。

00:01:50.000 --> 00:01:52.710
讓我們在這裡定義這一點。

00:01:52.710 --> 00:01:55.010
現在我有我的時間列名稱,

00:01:55.010 --> 00:01:58.520
將用於預測
我的目標列名稱。

00:01:58.520 --> 00:02:00.890
接下來,我要創建

00:02:00.890 --> 00:02:03.650
為局部變數
資料集,將保留

00:02:03.650 --> 00:02:05.570
跟蹤我的數據,我要

00:02:05.570 --> 00:02:08.360
轉換該資料集
到熊貓數據幀中。

00:02:08.360 --> 00:02:11.060
請注意,我打電話採取5,

00:02:11.060 --> 00:02:14.630
這會列印出第一個
此數據幀的五行。

00:02:14.630 --> 00:02:17.150
我們可以驗證
這些行是正確的。

00:02:17.150 --> 00:02:19.920
現在是2011年1月1日

00:02:19.920 --> 00:02:23.605
溫度是0.344167

00:02:23.605 --> 00:02:24.920
我們可以看看

00:02:24.920 --> 00:02:28.200
我們的 Csv 檔, 看到
還是 1 月 1 日

00:02:28.200 --> 00:02:36.440
2011年,天氣是
或溫度是 0.33344167 。

00:02:36.440 --> 00:02:39.620
看起來沒錯。現在我們
我們的資料之間有連結

00:02:39.620 --> 00:02:43.890
儲存在 Azure 和本地
可視化工作室代碼環境。

