WEBVTT

00:00:00.260 --> 00:00:03.735
• 数据科学生活
周期很有意义。

00:00:03.735 --> 00:00:05.400
现在我知道我想定义

00:00:05.400 --> 00:00:08.235
我的问题之前， 我做任何事情。

00:00:08.235 --> 00:00:11.310
因此，我的应用是基于服务的应用程序。

00:00:11.310 --> 00:00:14.205
这意味着这取决于
不仅使用数据，

00:00:14.205 --> 00:00:17.670
但也外部因素
喜欢天气和日期。

00:00:17.670 --> 00:00:20.640
例如，人们
租自行车可能

00:00:20.640 --> 00:00:24.150
看起来非常不同
假期相比，工作日。

00:00:24.150 --> 00:00:25.740
我知道我想用

00:00:25.740 --> 00:00:27.945
匿名数据，
我收集了我的应用程序，

00:00:27.945 --> 00:00:31.800
以及外部因素
喜欢日期和天气， 使

00:00:31.800 --> 00:00:34.020
更明智的决定如何

00:00:34.020 --> 00:00:37.065
我把我的
自行车在城市周围。

00:00:37.065 --> 00:00:39.480
我知道这
初步分析，

00:00:39.480 --> 00:00:41.895
我们今天做的只是第一步。

00:00:41.895 --> 00:00:43.940
我要采取
我学到什么， 我

00:00:43.940 --> 00:00:46.100
要改善什么数据我

00:00:46.100 --> 00:00:48.290
收集和什么问题，我

00:00:48.290 --> 00:00:51.920
问， 这样我就可以更多
在我的应用程序中成功。

00:00:51.920 --> 00:00:54.455
那么，对我来说，成功是什么样的呢？

00:00:54.455 --> 00:00:58.105
嗯，对我来说，这意味着更多
人们租自行车。

00:00:58.105 --> 00:01:00.560
现在我可以花更多的钱

00:01:00.560 --> 00:01:02.180
营销， 但另一种方式做

00:01:02.180 --> 00:01:04.115
这是确保
我的库存，

00:01:04.115 --> 00:01:07.525
我的自行车， 在右边
在正确的时间。

00:01:07.525 --> 00:01:09.800
现在，这是一个相当复杂的矩阵，

00:01:09.800 --> 00:01:13.340
所以，让我们拨下来
多一点， 专注于

00:01:13.340 --> 00:01:18.020
我可能需要多少辆自行车
在未来一小时内，

00:01:18.020 --> 00:01:21.160
或一天，甚至几分钟。

00:01:21.160 --> 00:01:23.565
所以，这将是我的问题。

00:01:23.565 --> 00:01:25.760
我想预测如何
许多自行车将

00:01:25.760 --> 00:01:28.595
租在未来一小时
在某个地方

00:01:28.595 --> 00:01:30.710
那么也许我可以移动我的库存

00:01:30.710 --> 00:01:33.760
该地区和更多
自行车将被出租。

00:01:33.760 --> 00:01:35.970
看起来我有

00:01:35.970 --> 00:01:39.015
一个很好的把握我的
业务理解。

00:01:39.015 --> 00:01:41.600
我真的不想搞砸
我的数据还挺的。

00:01:41.600 --> 00:01:43.610
我想得到一个初步的分析

00:01:43.610 --> 00:01:45.830
和理解
先发生了什么

00:01:45.830 --> 00:01:48.340
因此，下一步是
将是建模。

00:01:48.340 --> 00:01:50.360
然后，我想尝试部署

00:01:50.360 --> 00:01:52.280
这作为一个 Web 服务
因为我想试试

00:01:52.280 --> 00:01:54.260
在野外，看看我能否使

00:01:54.260 --> 00:01:57.260
任何预测和
改善这种加班。

00:01:57.260 --> 00:01:59.120
因此，让我们检查回来

00:01:59.120 --> 00:02:01.010
弗朗西斯卡，以便我们可以
多学习一点

00:02:01.010 --> 00:02:03.230
关于机器学习
模型，也许找到

00:02:03.230 --> 00:02:06.570
出哪一个我们应该
用于我们的问题。

