WEBVTT

00:00:02.870 --> 00:00:07.590
• 欢迎回到开发人员
数据科学导论。

00:00:07.590 --> 00:00:09.450
也许你们中许多人已经

00:00:09.450 --> 00:00:12.120
熟悉传统
编程逻辑。

00:00:12.120 --> 00:00:13.740
所以，让我们尝试了解

00:00:13.740 --> 00:00:15.360
机器学习在利用

00:00:15.360 --> 00:00:17.220
传统的编程逻辑。

00:00:17.220 --> 00:00:18.640
这是一个形象，

00:00:18.640 --> 00:00:20.670
这显示了如何区别

00:00:20.670 --> 00:00:24.580
创建传统编程
与机器学习模型。

00:00:24.580 --> 00:00:28.290
传统编程使用
美学程序逻辑

00:00:28.290 --> 00:00:30.405
获取特定的输出。

00:00:30.405 --> 00:00:32.780
静态结果基于

00:00:32.780 --> 00:00:35.075
算法中的程序逻辑。

00:00:35.075 --> 00:00:37.130
您的机器学习
并具体

00:00:37.130 --> 00:00:39.290
在监督的机器学习中，

00:00:39.290 --> 00:00:41.810
你有你的数据，这是

00:00:41.810 --> 00:00:44.090
你的功能，然后你有

00:00:44.090 --> 00:00:47.005
它在输出，这是您的标签。

00:00:47.005 --> 00:00:50.720
这通过
算法计算

00:00:50.720 --> 00:00:52.820
模型被创建，

00:00:52.820 --> 00:00:55.460
我们可以达到在基本
级别用户函数使用

00:00:55.460 --> 00:00:58.580
数学函数
使用数据创建。

00:00:58.580 --> 00:01:02.375
这称为训练
机器学习模型。

00:01:02.375 --> 00:01:06.710
在机器学习中，有
是两个不同的类别，

00:01:06.710 --> 00:01:09.470
一个被称为监督学习

00:01:09.470 --> 00:01:12.635
另一个是
无人监督的学习。

00:01:12.635 --> 00:01:14.870
监督意味着我们给予

00:01:14.870 --> 00:01:17.165
这两个数据的示例，

00:01:17.165 --> 00:01:19.280
用它来预测和答案。

00:01:19.280 --> 00:01:22.070
例如，是狗还是猫。

00:01:22.070 --> 00:01:25.130
我们将给予
模型标记图像

00:01:25.130 --> 00:01:28.605
的功能类别
狗和猫。

00:01:28.605 --> 00:01:32.445
我们会告诉他
什么是猫和狗。

00:01:32.445 --> 00:01:36.600
然后模型将学习
如何标记提供的数据。

00:01:36.600 --> 00:01:40.760
监督学习是当我们
给它一个未标记的数据集

00:01:40.760 --> 00:01:42.635
学习， 而不给它

00:01:42.635 --> 00:01:45.590
答案是什么
我们希望它学习。

00:01:45.590 --> 00:01:49.295
正如你所看到的，在
监督机器学习，

00:01:49.295 --> 00:01:52.460
有两种方法：
回归和分类。

00:01:52.460 --> 00:01:55.235
而在无人监督的情况下
机器学习，

00:01:55.235 --> 00:01:57.845
有三个不同的
方法：聚类，

00:01:57.845 --> 00:02:00.905
异常检测，
和建议。

00:02:00.905 --> 00:02:02.810
现在，我们有一点点

00:02:02.810 --> 00:02:05.210
理解什么
机器学习是，

00:02:05.210 --> 00:02:08.825
让我们看看模型
在高层构建过程。

00:02:08.825 --> 00:02:11.540
正如你所看到的，有
是四个主要阶段。

00:02:11.540 --> 00:02:14.090
我们说有准备
您的数据，训练你的模型，

00:02:14.090 --> 00:02:17.600
测试您的模型，以及
操作模型。

00:02:17.600 --> 00:02:18.875
A 准备数据，

00:02:18.875 --> 00:02:21.305
这是一个你需要找到的阶段

00:02:21.305 --> 00:02:22.985
选择并创建数据，

00:02:22.985 --> 00:02:27.620
应用预处理技术
也填补了数据的空白。

00:02:27.620 --> 00:02:33.455
火车模型意味着
你必须给你的模型

00:02:33.455 --> 00:02:36.590
具体数据，以便您的
模型要学习它

00:02:36.590 --> 00:02:40.175
从这些数据来预测
作为未来的东西。

00:02:40.175 --> 00:02:43.010
这是一个非常迭代的任务

00:02:43.010 --> 00:02:45.990
因为你可能需要
更改模型中的数据

00:02:45.990 --> 00:02:48.560
直到你认为你有

00:02:48.560 --> 00:02:52.190
良好的会计数据
生产阶段。

00:02:52.190 --> 00:02:54.020
测试模型，现在您有

00:02:54.020 --> 00:02:57.200
一个模型，你认为是
会表现的很好

00:02:57.200 --> 00:02:59.800
你可以测试它
权衡新数据。

00:02:59.800 --> 00:03:01.980
最后，操作模型。

00:03:01.980 --> 00:03:05.030
现在是操作的时候
你的模型，让你

00:03:05.030 --> 00:03:09.360
可以使用它从
不同的应用。

