WEBVTT

00:00:02.870 --> 00:00:07.590
• 歡迎回到開發人員
數據科學導論。

00:00:07.590 --> 00:00:09.450
也許你們中許多人已經

00:00:09.450 --> 00:00:12.120
熟悉傳統
程式設計邏輯。

00:00:12.120 --> 00:00:13.740
所以,讓我們嘗試瞭解

00:00:13.740 --> 00:00:15.360
機器學習在利用

00:00:15.360 --> 00:00:17.220
傳統的程式設計邏輯。

00:00:17.220 --> 00:00:18.640
這是一個形象,

00:00:18.640 --> 00:00:20.670
這顯示了如何區別

00:00:20.670 --> 00:00:24.580
建立傳統程式設計
與機器學習模型。

00:00:24.580 --> 00:00:28.290
傳統程式設計使用
美學程式邏輯

00:00:28.290 --> 00:00:30.405
獲取特定的輸出。

00:00:30.405 --> 00:00:32.780
靜態結果基於

00:00:32.780 --> 00:00:35.075
演演演算法中的程式邏輯。

00:00:35.075 --> 00:00:37.130
您的機器學習
並具體

00:00:37.130 --> 00:00:39.290
在監督的機器學習中,

00:00:39.290 --> 00:00:41.810
你有你的數據,這是

00:00:41.810 --> 00:00:44.090
你的功能,然後你有

00:00:44.090 --> 00:00:47.005
它在輸出,這是您的標籤。

00:00:47.005 --> 00:00:50.720
這通過
演算法計算

00:00:50.720 --> 00:00:52.820
模型被創建,

00:00:52.820 --> 00:00:55.460
我們可以達到在基本
等級使用者函數使用

00:00:55.460 --> 00:00:58.580
數學函數
使用數據創建。

00:00:58.580 --> 00:01:02.375
這稱為訓練
機器學習模型。

00:01:02.375 --> 00:01:06.710
在機器學習中,有
是兩個不同的類別,

00:01:06.710 --> 00:01:09.470
一個被稱為監督學習

00:01:09.470 --> 00:01:12.635
另一個是
無人監督的學習。

00:01:12.635 --> 00:01:14.870
監督意味著我們給予

00:01:14.870 --> 00:01:17.165
這兩個數據的示例,

00:01:17.165 --> 00:01:19.280
用它來預測和答案。

00:01:19.280 --> 00:01:22.070
例如,是狗還是貓。

00:01:22.070 --> 00:01:25.130
我們將給予
模型標記影像

00:01:25.130 --> 00:01:28.605
的類別
狗和貓。

00:01:28.605 --> 00:01:32.445
我們會告訴他
什麼是貓和狗。

00:01:32.445 --> 00:01:36.600
然後模型將學習
如何標記提供的數據。

00:01:36.600 --> 00:01:40.760
監督學習是當我們
給它一個未標記的資料集

00:01:40.760 --> 00:01:42.635
學習, 而不給它

00:01:42.635 --> 00:01:45.590
答案是什麼
我們希望它學習。

00:01:45.590 --> 00:01:49.295
正如你所看到的,在
監督機器學習,

00:01:49.295 --> 00:01:52.460
有兩種方法:
回歸和分類。

00:01:52.460 --> 00:01:55.235
而在無人監督的情況下
機器學習,

00:01:55.235 --> 00:01:57.845
有三個不同的
方法:聚類,

00:01:57.845 --> 00:02:00.905
異常檢測,
和建議。

00:02:00.905 --> 00:02:02.810
現在,我們有一點點

00:02:02.810 --> 00:02:05.210
理解什麼
機器學習是,

00:02:05.210 --> 00:02:08.825
讓我們看看模型
在高層構建過程。

00:02:08.825 --> 00:02:11.540
正如你所看到的,有
是四個主要階段。

00:02:11.540 --> 00:02:14.090
我們說有準備
您的數據,訓練你的模型,

00:02:14.090 --> 00:02:17.600
測試您的模型,以及
操作模型。

00:02:17.600 --> 00:02:18.875
A 準備數據,

00:02:18.875 --> 00:02:21.305
這是一個你需要找到的階段

00:02:21.305 --> 00:02:22.985
選擇並創建數據,

00:02:22.985 --> 00:02:27.620
應用預處理技術
也填補了數據的空白。

00:02:27.620 --> 00:02:33.455
火車模型意味著
你必須給你的模型

00:02:33.455 --> 00:02:36.590
具體資料,以便您的
模型要學習它

00:02:36.590 --> 00:02:40.175
從這些資料來預測
作為未來的東西。

00:02:40.175 --> 00:02:43.010
這是一個非常反覆運算的任務

00:02:43.010 --> 00:02:45.990
因為你可能需要
變更模型中的資料

00:02:45.990 --> 00:02:48.560
直到你認為你有

00:02:48.560 --> 00:02:52.190
良好的會計資料
生產階段。

00:02:52.190 --> 00:02:54.020
測試模型,現在您有

00:02:54.020 --> 00:02:57.200
一個模型,你認為是
會表現的很好

00:02:57.200 --> 00:02:59.800
你可以測試它
權衡新數據。

00:02:59.800 --> 00:03:01.980
最後,操作模型。

00:03:01.980 --> 00:03:05.030
現在是操作的時候
你的模型,讓你

00:03:05.030 --> 00:03:09.360
可以使用它從
不同的應用。

