WEBVTT

00:00:02.180 --> 00:00:07.505
>> 開発者へようこそ
データサイエンスの概要

00:00:07.505 --> 00:00:10.390
それでは、もっと学びましょう
選び方について

00:00:10.390 --> 00:00:11.680
のための最良のモデル

00:00:11.680 --> 00:00:15.100
データ サイエンス シナリオを使用する
自動化された機械学習。

00:00:15.100 --> 00:00:17.800
理解
セットの予測力

00:00:17.800 --> 00:00:20.420
敬意を持って特徴の
従属変数に

00:00:20.420 --> 00:00:21.970
非常にトリッキーな問題です,

00:00:21.970 --> 00:00:23.770
普遍的なメトリックが存在しない

00:00:23.770 --> 00:00:26.155
それを行う方法を教えてくれます。

00:00:26.155 --> 00:00:28.120
だから、質問に対する答えは、

00:00:28.120 --> 00:00:31.180
どのアルゴリズムが私にあるべきか
使用は常に、それは依存します。

00:00:31.180 --> 00:00:33.400
それはサイズ、品質、によって異なります。

00:00:33.400 --> 00:00:35.170
データの性質、

00:00:35.170 --> 00:00:39.205
それはあなたがしたいのかによって異なります
その具体的な答えと一緒に行います。

00:00:39.205 --> 00:00:41.650
最後に、質問に対する答えは、

00:00:41.650 --> 00:00:45.119
どのパラメーターを使用すべきか
また、非常に困難です。

00:00:45.119 --> 00:00:47.090
ご存知のように、ハイパーパラメーターは

00:00:47.090 --> 00:00:50.435
上位レベルのパラメータ
学べない

00:00:50.435 --> 00:00:53.030
を使用してデータから直接

00:00:53.030 --> 00:00:56.215
勾配降下またはその他
最適化アルゴリズム。

00:00:56.215 --> 00:00:59.600
構造を説明する。
モデルに関する情報

00:00:59.600 --> 00:01:03.380
前に決定する必要があります。
モデル パラメータを適合する。

00:01:03.380 --> 00:01:06.125
モデル パラメータ設定
前に検索

00:01:06.125 --> 00:01:08.860
に基づく最適なパラメータ値

00:01:08.860 --> 00:01:13.065
学習と経験は、
また、非常に時間がかかります。

00:01:13.065 --> 00:01:16.085
異なる推定値
より適しています

00:01:16.085 --> 00:01:19.160
異なるタイプのデータ
また、異なる問題。

00:01:19.160 --> 00:01:22.610
だから私はしばしばそう言うだろう
解決の最も難しい部分

00:01:22.610 --> 00:01:24.170
機械学習の問題は、次のことができます

00:01:24.170 --> 00:01:27.175
権利を見つける
あなたの仕事の見積もり。

00:01:27.175 --> 00:01:31.100
だから私は非常に頻繁に使用しています
自動化された機械学習、

00:01:31.100 --> 00:01:34.070
のプロセスである
時間のかかる自動化

00:01:34.070 --> 00:01:37.295
機械の反復的な仕事
モデル開発を学ぶ。

00:01:37.295 --> 00:01:41.510
自動機械学習
不確実性を考慮に入れ、

00:01:41.510 --> 00:01:43.940
彼らの組み込み
確率論的モデル

00:01:43.940 --> 00:01:47.090
最善を決定する
パイプラインを使用して次に試してみてください。

00:01:47.090 --> 00:01:51.350
このアプローチでは、
自動化された機械学習

00:01:51.350 --> 00:01:55.925
最も有望なを探る
時間を無駄にすることなく可能性。

00:01:55.925 --> 00:01:58.080
それでは、詳しく見てみましょう。

00:01:58.080 --> 00:02:01.790
異なる自動化
機械学習機能。

00:02:01.790 --> 00:02:04.670
まず、自動で
必要な機械学習

00:02:04.670 --> 00:02:08.255
機械学習を識別する
あなたが解決したい問題。

00:02:08.255 --> 00:02:11.914
これらは分類であり、
予測、または回帰。

00:02:11.914 --> 00:02:14.060
次に、ソースを指定する必要があります。

00:02:14.060 --> 00:02:16.600
の形式と
ラベル付きトレーニングデータ。

00:02:16.600 --> 00:02:20.420
これはNumPyになるだろう
配列またはパンダのデータフレーム。

00:02:20.420 --> 00:02:22.640
最後に、次の手順に

00:02:22.640 --> 00:02:25.055
コンピュータターゲット
モデルトレーニング用、

00:02:25.055 --> 00:02:27.064
ローカル コンピュータなど、

00:02:27.064 --> 00:02:30.380
Azure の機械学習
計算、リモート VM、

00:02:30.380 --> 00:02:32.825
そのため、Azure データブリックなど、

00:02:32.825 --> 00:02:35.240
そして訓練の間に
Azure の機械学習

00:02:35.240 --> 00:02:37.700
基本的に多くの人に仕える

00:02:37.700 --> 00:02:42.635
試みる比類のないパイプライン
異なるアルゴリズムとパラメータ。

00:02:42.635 --> 00:02:45.140
それはそれがヒットした後にのみ停止します

00:02:45.140 --> 00:02:49.345
終了基準
実験で定義します。

00:02:49.345 --> 00:02:54.330
クラスは表します
提出のための構成

00:02:54.330 --> 00:02:56.500
自動化された機械学習

00:02:56.500 --> 00:02:59.310
をテストする方法は、Azure の機械学習で行います。

00:02:59.310 --> 00:03:02.710
この構成オブジェクト
を含み、次に進みます

00:03:02.710 --> 00:03:06.245
構成用のパラメータ
周りの実験、

00:03:06.245 --> 00:03:10.145
トレーニングデータと同様に、
実行時に使用する必要があります。

00:03:10.145 --> 00:03:14.070
詳細については、以下を参照してください。
aka.ms/AutoMLConfig-Class。

