WEBVTT

00:00:00.000 --> 00:00:02.610
终于到了
玩我们的数据。

00:00:02.610 --> 00:00:04.830
我有一个本地的CSV文件与所有

00:00:04.830 --> 00:00:08.235
我的数据， 我需要确保
进入云。

00:00:08.235 --> 00:00:10.740
此外，我需要
准备我的数据

00:00:10.740 --> 00:00:12.750
我知道我想做的就是

00:00:12.750 --> 00:00:15.865
预测多少自行车将
某天租。

00:00:15.865 --> 00:00:19.770
这意味着我需要准备我的
时间序列预测的数据。

00:00:19.770 --> 00:00:22.790
一如既往，有
有关其他文档

00:00:22.790 --> 00:00:26.350
屏幕， 然后描述
下面。让我们开始吧。

00:00:26.350 --> 00:00:30.750
首先，我需要确保
我的数据集是可访问的。

00:00:31.600 --> 00:00:33.980
我要添加它
到同一文件夹

00:00:33.980 --> 00:00:36.420
我的朱皮特笔记本在

00:00:36.880 --> 00:00:40.174
我要上传此数据集

00:00:40.174 --> 00:00:42.955
到我的机器学习
数据存储在 Azure 上。

00:00:42.955 --> 00:00:45.355
我会抓住我的CSV文件

00:00:45.355 --> 00:00:47.825
将其上传到数据集文件夹，

00:00:47.825 --> 00:00:50.900
覆盖任何数据
已经存在的

00:00:50.900 --> 00:00:53.000
我想展示的进展

00:00:53.000 --> 00:00:56.045
这个过程内
可视化工作室代码。

00:00:56.045 --> 00:00:58.640
太好了， 看起来成功了。

00:00:58.640 --> 00:01:03.010
接下来，我需要创建
数据集对象，

00:01:03.010 --> 00:01:06.910
这是一个类
azureml 核心， 我需要

00:01:06.910 --> 00:01:08.935
格式化我的日期在
的方式， 我会使它

00:01:08.935 --> 00:01:11.755
更容易为我的数据排序。

00:01:11.755 --> 00:01:15.050
我需要导入一些类。

00:01:15.250 --> 00:01:18.220
现在我需要弄清楚
我要去哪个列

00:01:18.220 --> 00:01:21.295
用于预测哪个其他列。

00:01:21.295 --> 00:01:22.855
在我决定之前

00:01:22.855 --> 00:01:25.210
我要打开 Csv 文件

00:01:25.210 --> 00:01:27.970
看看
我拥有的数据。

00:01:27.970 --> 00:01:30.685
我注意到我这里有约会

00:01:30.685 --> 00:01:34.540
季节，年，月，
一周中哪一天

00:01:34.540 --> 00:01:37.870
天气是什么，
温度 湿度

00:01:37.870 --> 00:01:41.160
风速，
我也算数，

00:01:41.160 --> 00:01:43.805
这是自行车的数量
已出租。

00:01:43.805 --> 00:01:49.650
我想我要做的就是
使用日期预测计数。

00:01:50.000 --> 00:01:52.710
让我们在这里定义这一点。

00:01:52.710 --> 00:01:55.010
现在我有我的时间列名称，

00:01:55.010 --> 00:01:58.520
将用于预测
我的目标列名称。

00:01:58.520 --> 00:02:00.890
接下来，我要创建

00:02:00.890 --> 00:02:03.650
称为局部变量
数据集，将保留

00:02:03.650 --> 00:02:05.570
跟踪我的数据，我要

00:02:05.570 --> 00:02:08.360
转换该数据集
到熊猫数据帧中。

00:02:08.360 --> 00:02:11.060
请注意，我打电话采取5，

00:02:11.060 --> 00:02:14.630
这将打印出第一个
此数据帧的五行。

00:02:14.630 --> 00:02:17.150
我们可以验证
这些行是正确的。

00:02:17.150 --> 00:02:19.920
现在是2011年1月1日

00:02:19.920 --> 00:02:23.605
温度是0.344167

00:02:23.605 --> 00:02:24.920
我们可以看看

00:02:24.920 --> 00:02:28.200
我们的 Csv 文件， 看到
还是 1 月 1 日

00:02:28.200 --> 00:02:36.440
2011年，天气是
或温度是 0.33344167 。

00:02:36.440 --> 00:02:39.620
看起来没错。现在我们
我们的数据之间有链接

00:02:39.620 --> 00:02:43.890
存储在 Azure 和本地
可视化工作室代码环境。

