WEBVTT

00:00:02.000 --> 00:00:05.040
• 大家好, 歡迎回到

00:00:05.040 --> 00:00:07.890
開發人員簡介
到數據科學。

00:00:07.890 --> 00:00:10.560
數據科學機器學習和人工智慧,

00:00:10.560 --> 00:00:14.250
都是至關重要的, 但如何
你開始和他們一起嗎?

00:00:14.250 --> 00:00:16.110
在這個視頻中,我們將學習

00:00:16.110 --> 00:00:18.660
什麼是數據科學生命週期。

00:00:18.660 --> 00:00:22.560
生命週期設計用於
資料科學專案

00:00:22.560 --> 00:00:27.480
打算作為
您的智慧應用。

00:00:27.480 --> 00:00:30.150
資料科學的生命週期是

00:00:30.150 --> 00:00:32.850
由五個主要
階段是;

00:00:32.850 --> 00:00:36.540
業務理解、資料
獲得和理解,

00:00:36.540 --> 00:00:40.110
建模、部署、
和客戶的認可。

00:00:40.110 --> 00:00:43.245
讓我們從
業務理解。

00:00:43.245 --> 00:00:46.035
這裡有兩個主要目標。

00:00:46.035 --> 00:00:49.310
第一個是
定義目標。

00:00:49.310 --> 00:00:50.570
您需要使用

00:00:50.570 --> 00:00:53.540
您的客戶和其他
利益相關者要瞭解,

00:00:53.540 --> 00:00:55.625
識別業務問題。

00:00:55.625 --> 00:00:59.610
第二個目標是
標識數據源。

00:00:59.610 --> 00:01:02.600
您要找到相關
有助於您回答的資料

00:01:02.600 --> 00:01:04.310
定義的問題

00:01:04.310 --> 00:01:07.310
您的目標
數據科學專案。

00:01:07.310 --> 00:01:11.030
在此之後,我們有資料
獲得和理解。

00:01:11.030 --> 00:01:15.800
這裡的目標是什麼,生產
一個乾淨、高質量的數據集,

00:01:15.800 --> 00:01:18.425
並開發一個
解決方案架構結構

00:01:18.425 --> 00:01:22.375
數據管道,
刷新並記錄數據。

00:01:22.375 --> 00:01:24.090
有三個主要步驟,

00:01:24.090 --> 00:01:26.280
正如你所看到的。輸入數據。

00:01:26.280 --> 00:01:28.310
在這裡,你需要
將資料引入

00:01:28.310 --> 00:01:31.535
目標分析環境
你要用的

00:01:31.535 --> 00:01:34.460
那麼你需要探索
資料,以確定是否

00:01:34.460 --> 00:01:37.340
資料品質好
足以回答這個問題

00:01:37.340 --> 00:01:39.230
最後,你需要設置

00:01:39.230 --> 00:01:43.055
要評分的資料導管
新的和刷新數據。

00:01:43.055 --> 00:01:46.275
在此之後,有
建模階段。

00:01:46.275 --> 00:01:50.250
這裡的主要目標是
特徵工程,

00:01:50.250 --> 00:01:52.550
您必須建立
資料要素來自

00:01:52.550 --> 00:01:55.250
原始資料,以方便
模型訓練。

00:01:55.250 --> 00:01:58.190
模型培訓,您需要
找到模型,

00:01:58.190 --> 00:02:01.390
回答問題
一個非常準確的方式,

00:02:01.390 --> 00:02:03.395
你還需要比較

00:02:03.395 --> 00:02:05.780
不同的成功指標,以便

00:02:05.780 --> 00:02:08.420
瞭解什麼是最好的
您的解決方案模型,

00:02:08.420 --> 00:02:10.520
最後,您需要確定

00:02:10.520 --> 00:02:13.190
您的模型適合
用於生產,

00:02:13.190 --> 00:02:15.950
已準備好部署。

00:02:15.950 --> 00:02:19.470
最後,還有部署。

00:02:19.470 --> 00:02:22.880
在這裡,我們需要部署
模型與導管到

00:02:22.880 --> 00:02:26.360
生產環境
應用程式消耗。

00:02:26.360 --> 00:02:27.860
要部署模型,

00:02:27.860 --> 00:02:31.775
你需要暴露他們
具有開放的 API 介面。

00:02:31.775 --> 00:02:34.505
介面使模型能夠

00:02:34.505 --> 00:02:37.670
容易從不同的消耗
應用程式的類型。

00:02:37.670 --> 00:02:41.250
這些範例
申請是在線網站,

00:02:41.250 --> 00:02:45.425
電子表格、儀錶板、
端到端應用程式。

00:02:45.425 --> 00:02:50.405
在此之後,您需要完成
您的專案可交付成果。

00:02:50.405 --> 00:02:53.480
您需要確認
管道,模型,

00:02:53.480 --> 00:02:56.925
及其部署在
滿足生產環境,

00:02:56.925 --> 00:03:01.345
當然, 也是您的客戶
或利益相關者的目標。

00:03:01.345 --> 00:03:03.800
您可以瞭解有關

00:03:03.800 --> 00:03:08.610
資料科學生命週期在
aka.ms/datasciencelifecycle.

