WEBVTT

00:00:02.180 --> 00:00:07.505
• 歡迎回到開發人員
數據科學簡介。

00:00:07.505 --> 00:00:10.390
現在,讓我們瞭解更多
關於你如何選擇

00:00:10.390 --> 00:00:11.680
最好的模型

00:00:11.680 --> 00:00:15.100
您的資料科學場景
自動化機器學習。

00:00:15.100 --> 00:00:17.800
瞭解
一組的預測能力

00:00:17.800 --> 00:00:20.420
尊重功能
到依賴變數,

00:00:20.420 --> 00:00:21.970
是一個非常棘手的問題

00:00:21.970 --> 00:00:23.770
也沒有通用指標

00:00:23.770 --> 00:00:26.155
可以告訴你怎麼做

00:00:26.155 --> 00:00:28.120
所以問題的答案,

00:00:28.120 --> 00:00:31.180
我應該使用哪種演演算法
使用總是, 這取決於。

00:00:31.180 --> 00:00:33.400
這取決於尺寸,品質,

00:00:33.400 --> 00:00:35.170
和數據的性質,

00:00:35.170 --> 00:00:39.205
這取決於你想做什麼
做這個具體的答案。

00:00:39.205 --> 00:00:41.650
最後,問題的答案,

00:00:41.650 --> 00:00:45.119
我應該使用哪些參數
也是非常具有挑戰性的。

00:00:45.119 --> 00:00:47.090
如您瞭解,超等等器是

00:00:47.090 --> 00:00:50.435
更高等級參數
無法學習

00:00:50.435 --> 00:00:53.030
直接從資料使用

00:00:53.030 --> 00:00:56.215
梯度下降或其他
優化演演演算法。

00:00:56.215 --> 00:00:59.600
他們描述了結構
有關模型的資訊,

00:00:59.600 --> 00:01:03.380
必須在之前決定
擬合模型參數。

00:01:03.380 --> 00:01:06.125
模型參數設定
與搜尋之前

00:01:06.125 --> 00:01:08.860
基於最優參數值

00:01:08.860 --> 00:01:13.065
學習和經驗可以
也非常耗時。

00:01:13.065 --> 00:01:16.085
不同的估計器
更適合

00:01:16.085 --> 00:01:19.160
用於不同類型的資料
以及不同的問題。

00:01:19.160 --> 00:01:22.610
我經常說
解決中最難的部分

00:01:22.610 --> 00:01:24.170
機器學習問題可能是

00:01:24.170 --> 00:01:27.175
找到合適的
工作估計器。

00:01:27.175 --> 00:01:31.100
這就是為什麼我經常使用
自動化機器學習,

00:01:31.100 --> 00:01:34.070
這是過程
自動化耗時

00:01:34.070 --> 00:01:37.295
與機器的反覆運算任務
學習模型開發。

00:01:37.295 --> 00:01:41.510
自動機器學習
考慮到不確定性,

00:01:41.510 --> 00:01:43.940
結合他們的
概率模型到

00:01:43.940 --> 00:01:47.090
確定最佳
管道嘗試下一個。

00:01:47.090 --> 00:01:51.350
這種方法允許
自動機器學習到

00:01:51.350 --> 00:01:55.925
探索最有前途的
可能性,而不浪費時間。

00:01:55.925 --> 00:01:58.080
現在,讓我們仔細看看

00:01:58.080 --> 00:02:01.790
不同的自動化
機器學習功能。

00:02:01.790 --> 00:02:04.670
首先,與自動化
機器學習,您需要

00:02:04.670 --> 00:02:08.255
識別機器學習
你想解決的問題。

00:02:08.255 --> 00:02:11.914
這些可以是分類,
預測或回歸。

00:02:11.914 --> 00:02:14.060
然後,您必須指定來源

00:02:14.060 --> 00:02:16.600
與格式
標記的訓練數據。

00:02:16.600 --> 00:02:20.420
這將是 Numpy
數位或熊貓數據幀。

00:02:20.420 --> 00:02:22.640
最後,您必須設定

00:02:22.640 --> 00:02:25.055
電腦目標
模型培訓,

00:02:25.055 --> 00:02:27.064
比如你的本地計算機,

00:02:27.064 --> 00:02:30.380
Azure 機器學習
計算,遠端 VM,

00:02:30.380 --> 00:02:32.825
因此,我們的 Azure 數據磚,例如,

00:02:32.825 --> 00:02:35.240
在培訓期間
Azure 機器學習

00:02:35.240 --> 00:02:37.700
基本上服務到一些

00:02:37.700 --> 00:02:42.635
試著的 imparallel 導管
不同的演演演算法和參數。

00:02:42.635 --> 00:02:45.140
它只會停止, 一旦它擊中

00:02:45.140 --> 00:02:49.345
退出準則,你
在實驗中定義。

00:02:49.345 --> 00:02:54.330
自動MLConfig 類別表示
提交的設定

00:02:54.330 --> 00:02:56.500
自動化機器學習

00:02:56.500 --> 00:02:59.310
在 Azure 機器學習中進行實驗。

00:02:59.310 --> 00:03:02.710
此設定物件
包含和收益

00:03:02.710 --> 00:03:06.245
設定的參數
周圍的實驗,

00:03:06.245 --> 00:03:10.145
以及培訓數據,
需要在運行時使用。

00:03:10.145 --> 00:03:14.070
要瞭解更多資訊,請參閱
aka.ms/AutoMLConfig-Class.

