WEBVTT

00:00:03.200 --> 00:00:08.100
• 欢迎回到开发人员
数据科学的介绍。

00:00:08.100 --> 00:00:12.510
一个常见的问题表明
许多客户、开发人员、

00:00:12.510 --> 00:00:15.030
但数据科学家也问我是，

00:00:15.030 --> 00:00:18.690
哪个机器学习
我应该使用算法吗？

00:00:18.690 --> 00:00:24.465
我总是回答， 这取决于
许多不同的因素。

00:00:24.465 --> 00:00:27.300
但最重要的是，
您选择的算法取决于

00:00:27.300 --> 00:00:30.750
在你的一个方面
数据科学场景。

00:00:30.750 --> 00:00:32.880
您想要什么？
处理您的数据吗？

00:00:32.880 --> 00:00:36.515
这是最重要的问题
你应该问问自己

00:00:36.515 --> 00:00:39.200
具体来说，另一个
重要的问题是

00:00:39.200 --> 00:00:41.870
什么是业务
你想的问题

00:00:41.870 --> 00:00:45.305
通过学习回答
从你过去的数据？

00:00:45.305 --> 00:00:48.679
机器学习有许多
不同的算法，

00:00:48.679 --> 00:00:51.740
和每种不同的算法
可以帮助您实现

00:00:51.740 --> 00:00:55.200
不同的目标和答案
另一个问题。

00:00:55.200 --> 00:00:57.615
让我们看看其中一些。

00:00:57.615 --> 00:01:01.755
第一个是预测
不同类别之间。

00:01:01.755 --> 00:01:04.940
在这里，我们有两个不同的
方法类型，

00:01:04.940 --> 00:01:07.160
我们有两个类
分类

00:01:07.160 --> 00:01:08.960
这是伟大的回答

00:01:08.960 --> 00:01:12.315
问题是
两个选择问题，

00:01:12.315 --> 00:01:15.150
喜欢是或否， 真或假。

00:01:15.150 --> 00:01:18.545
然后，我们有
多类分类，

00:01:18.545 --> 00:01:21.110
这是伟大的回答
复杂问题

00:01:21.110 --> 00:01:24.355
具有多个可能的选项。

00:01:24.355 --> 00:01:27.560
您也可以使用机器
学习您的数据

00:01:27.560 --> 00:01:30.405
发现数据中的合作伙伴。

00:01:30.405 --> 00:01:32.450
在这里，我们有三种不同类型的

00:01:32.450 --> 00:01:34.805
方法，如推荐者，

00:01:34.805 --> 00:01:37.400
是擅长预测什么

00:01:37.400 --> 00:01:40.220
有人会感兴趣
在未来。

00:01:40.220 --> 00:01:46.085
聚类擅长分离
类似的数据点成组。

00:01:46.085 --> 00:01:50.030
最后，异常检测，
这是伟大的

00:01:50.030 --> 00:01:55.450
识别和预测
罕见或异常数据点。

00:01:55.450 --> 00:01:58.715
另一件事，你可以做
与您的数据实际上是

00:01:58.715 --> 00:02:02.405
了解什么
图像正在呈现，

00:02:02.405 --> 00:02:05.045
也理解
自然语言。

00:02:05.045 --> 00:02:08.960
在这里，我们有这样的方法
作为图像分类，

00:02:08.960 --> 00:02:13.130
能够识别
图像与神经网络。

00:02:13.130 --> 00:02:16.325
此外文本分析，这是能够

00:02:16.325 --> 00:02:20.660
派生高质量
来自文本的信息。

00:02:20.660 --> 00:02:23.150
最后，如果您需要预测

00:02:23.150 --> 00:02:26.285
基于
值之间的关系，

00:02:26.285 --> 00:02:29.930
您可以使用其他
回归方法的类型。

00:02:29.930 --> 00:02:34.310
回归后，
一般作出预测

00:02:34.310 --> 00:02:39.580
估计关系
在价值观之间。

00:02:39.580 --> 00:02:44.715
对于此特定用例
萨拉试图解决

00:02:44.715 --> 00:02:46.980
我认为我们需要预测

00:02:46.980 --> 00:02:50.395
有多少辆自行车
租在未来一个小时。

00:02:50.395 --> 00:02:53.660
我真的认为，
预测，最重要的是，

00:02:53.660 --> 00:02:58.460
回归是正确的方法
我们应该使用，因为我们

00:02:58.460 --> 00:03:00.620
真的想预测一个结果

00:03:00.620 --> 00:03:04.290
基于关系
值之间的。

