WEBVTT

00:00:02.000 --> 00:00:05.040
>> こんにちは皆さん、そしてへようこそ

00:00:05.040 --> 00:00:07.890
開発者はじめに
データサイエンスに。

00:00:07.890 --> 00:00:10.560
データサイエンスの機械学習とAI、

00:00:10.560 --> 00:00:14.250
すべて重要ですが、どのように
あなたは彼らと一緒に始める?

00:00:14.250 --> 00:00:16.110
このビデオでは、私たちは学ぶつもりです

00:00:16.110 --> 00:00:18.660
データ サイエンスのライフサイクルとは何か。

00:00:18.660 --> 00:00:22.560
ライフサイクルは、
データ サイエンス プロジェクト

00:00:22.560 --> 00:00:27.480
の一部として形状を作成することを意図
インテリジェントなアプリケーションを使用できます。

00:00:27.480 --> 00:00:30.150
データ サイエンスのライフサイクルは、

00:00:30.150 --> 00:00:32.850
5つのメジャーで構成される
ステージ。

00:00:32.850 --> 00:00:36.540
ビジネス理解, データ
取得および理解、

00:00:36.540 --> 00:00:40.110
モデリング、展開、
そして顧客の受け入れ。

00:00:40.110 --> 00:00:43.245
最初から始めましょう
ビジネス理解。

00:00:43.245 --> 00:00:46.035
ここでは、2つの主な目標があります。

00:00:46.035 --> 00:00:49.310
最初のものは約です
目的を定義する。

00:00:49.310 --> 00:00:50.570
あなたは一緒に作業する必要があります

00:00:50.570 --> 00:00:53.540
顧客および他の顧客
利害関係者が理解し、

00:00:53.540 --> 00:00:55.625
ビジネス上の問題を特定する。

00:00:55.625 --> 00:00:59.610
2番目の目標は約です
データ ソースの識別

00:00:59.610 --> 00:01:02.600
関連するを見つける必要があります。
あなたが答えるのに役立つデータ

00:01:02.600 --> 00:01:04.310
定義する質問

00:01:04.310 --> 00:01:07.310
の目的
データ サイエンス プロジェクト。

00:01:07.310 --> 00:01:11.030
この後、我々はデータを持っています
取得と理解。

00:01:11.030 --> 00:01:15.800
ここでの目標は、生産することです
クリーンで高品質なデータセット

00:01:15.800 --> 00:01:18.425
を開発し、
ソリューション アーキテクチャの

00:01:18.425 --> 00:01:22.375
データパイプライン
データを更新してスコアを付けます。

00:01:22.375 --> 00:01:24.090
3つの主要なステップがあります。

00:01:24.090 --> 00:01:26.280
ご覧の通り。データを取り込みます。

00:01:26.280 --> 00:01:28.310
ここでは、する必要があります
データを取り込む

00:01:28.310 --> 00:01:31.535
標的分析環境
あなたが使用するつもりであることを、

00:01:31.535 --> 00:01:34.460
その後、探検する必要があります
を決定するデータ

00:01:34.460 --> 00:01:37.340
データ品質が良好
質問に答えるのに十分な、

00:01:37.340 --> 00:01:39.230
最後に、セットアップする必要があります

00:01:39.230 --> 00:01:43.055
スコアを付けるデータパイプライン
新しいデータと更新データを更新します。

00:01:43.055 --> 00:01:46.275
この後、あります
モデリング段階を示します。

00:01:46.275 --> 00:01:50.250
ここでの主な目標は
機能エンジニアリング,

00:01:50.250 --> 00:01:52.550
を作成する必要があります。
データ機能

00:01:52.550 --> 00:01:55.250
容易にするための生データ
モデルトレーニングを行います。

00:01:55.250 --> 00:01:58.190
モデルトレーニング、必要な
をクリックして、モデルを見つける

00:01:58.190 --> 00:02:01.390
で質問に答える
非常に正確な方法、

00:02:01.390 --> 00:02:03.395
また、比較する必要があります

00:02:03.395 --> 00:02:05.780
に対して異なる成功指標

00:02:05.780 --> 00:02:08.420
何が一番いいのかを理解する
ソリューションのモデル

00:02:08.420 --> 00:02:10.520
最後に、次に、かどうかを判断する必要があります。

00:02:10.520 --> 00:02:13.190
あなたのモデルは適しています
生産用,

00:02:13.190 --> 00:02:15.950
は、展開する準備ができています。

00:02:15.950 --> 00:02:19.470
最後に、展開があります。

00:02:19.470 --> 00:02:22.880
ここで、展開する必要があります。
モデルとパイプラインの

00:02:22.880 --> 00:02:26.360
の生産環境
アプリケーション消費。

00:02:26.360 --> 00:02:27.860
モデルを展開するには、

00:02:27.860 --> 00:02:31.775
あなたはそれらを公開する必要があります
オープンな API インターフェイスを使用します。

00:02:31.775 --> 00:02:34.505
このインタフェースにより、モデルは

00:02:34.505 --> 00:02:37.670
異なるから容易に消費される
アプリケーションの種類。

00:02:37.670 --> 00:02:41.250
これらのいくつかの例
アプリケーションは、オンラインウェブサイトです,

00:02:41.250 --> 00:02:45.425
スプレッドシート、ダッシュボード、
バックエンド アプリケーション。

00:02:45.425 --> 00:02:50.405
この後、あなたは、終了する必要があります
プロジェクトの成果物を作成できます。

00:02:50.405 --> 00:02:53.480
確認する必要があります。
パイプライン、モデル、

00:02:53.480 --> 00:02:56.925
そして、その展開
満足する生産環境、

00:02:56.925 --> 00:03:01.345
もちろん、あなたの顧客も
または利害関係者の目標。

00:03:01.345 --> 00:03:03.800
詳細については、こちらをご覧ください。

00:03:03.800 --> 00:03:08.610
でのデータ サイエンス のライフサイクル
aka.ms/datasciencelifecycle。

