WEBVTT

00:00:09.680 --> 00:00:10.780
[ 音樂]

00:00:10.780 --> 00:00:12.750
[ ] 嗨。我是薇琪·哈普
SQL Server 產品團隊。

00:00:12.750 --> 00:00:15.870
我今天在這裡告訴你
筆記本和 Azure 資料工作室。

00:00:15.870 --> 00:00:18.825
因此，筆記本是一個概念

00:00:18.825 --> 00:00:20.660
資料科學

00:00:20.660 --> 00:00:22.940
用來做很多
資料視覺化，

00:00:22.940 --> 00:00:25.010
資料勘探和資料工作，

00:00:25.010 --> 00:00:26.855
主要是在Python語言中。

00:00:26.855 --> 00:00:28.760
當人們說話時
關於筆記本，

00:00:28.760 --> 00:00:30.485
很多時候，我們談論
關於木星筆記本。

00:00:30.485 --> 00:00:32.660
因此，筆記本的實現

00:00:32.660 --> 00:00:34.730
我們在 Azure 資料工作室中是

00:00:34.730 --> 00:00:37.070
木星筆記本與
自訂前端

00:00:37.070 --> 00:00:40.430
更好地定制，以適應
Azure 資料工作室體驗。

00:00:40.430 --> 00:00:45.450
所以首先，我要展示
你一個簡單的Python筆記本。

00:00:45.450 --> 00:00:46.760
這是一個筆記本，具有

00:00:46.760 --> 00:00:49.250
Python 語言和
你可以看到我們已經得到了

00:00:49.250 --> 00:00:51.620
一節在這裡，這是

00:00:51.620 --> 00:00:54.395
人類可讀的文本和
下面有代碼的節。

00:00:54.395 --> 00:00:56.149
所以，如果我擊中運行這個，

00:00:56.149 --> 00:00:58.010
這個特殊的代碼調用

00:00:58.010 --> 00:01:00.755
互聯網和拉下一個
隨機拍攝的狗。

00:01:00.755 --> 00:01:03.710
向您展示
筆記本體驗，

00:01:03.710 --> 00:01:05.390
我們這裡有個採摘機

00:01:05.390 --> 00:01:06.770
我們可以選擇語言。

00:01:06.770 --> 00:01:08.630
所以在這種情況下，我
運行 Python 3，

00:01:08.630 --> 00:01:10.475
我運行它
在我的本地機器上。

00:01:10.475 --> 00:01:13.460
我可以搬到
語言 SQL，然後

00:01:13.460 --> 00:01:16.430
選擇哪個 MySQL 伺服器
我想連接到的機器。

00:01:16.430 --> 00:01:18.605
我在此處列出了 MySQL 伺服器。

00:01:18.605 --> 00:01:21.830
所以再往前走一點，

00:01:21.830 --> 00:01:24.230
我給你舉個例子
如何使用這個。

00:01:24.230 --> 00:01:28.025
所以在這裡我有一個SQL伺服器
2019 大資料集群

00:01:28.025 --> 00:01:32.555
是 SQL 伺服器在庫伯內特斯運行
SQL 和 Spark。

00:01:32.555 --> 00:01:34.490
所以在我的 HDFS 部分，

00:01:34.490 --> 00:01:38.040
我拿到了這個目錄
充滿了CSV檔。

00:01:38.040 --> 00:01:40.890
如果我看一下，預覽它，

00:01:40.890 --> 00:01:42.260
你可以看到，這是很多

00:01:42.260 --> 00:01:44.780
關於狗的資訊
許可證資訊。

00:01:44.780 --> 00:01:46.970
因此，這實際上是資料轉儲

00:01:46.970 --> 00:01:48.320
賓夕法尼亞的阿萊格尼縣

00:01:48.320 --> 00:01:51.230
狗許可證
持續幾年。

00:01:51.230 --> 00:01:55.775
因此，使用火花
語言和連接

00:01:55.775 --> 00:02:00.440
到 Python 使用 Spark 上
SQL 伺服器大資料群集。

00:02:00.440 --> 00:02:02.045
我能跑

00:02:02.045 --> 00:02:05.780
代碼讀取這些檔
直接退出 CSV。

00:02:05.780 --> 00:02:07.760
然後我可以做一些分析。

00:02:07.760 --> 00:02:09.890
所以在這種情況下，我要
獲取行的計數。

00:02:09.890 --> 00:02:15.645
我要列出不同的
清單只是名字，

00:02:15.645 --> 00:02:17.215
所以我們有25，000個名字

00:02:17.215 --> 00:02:20.825
然後，我要拉一個
隨機的名字，從帽子。

00:02:20.825 --> 00:02:22.550
因此，我們有一個名字在這裡。

00:02:22.550 --> 00:02:25.850
現在，如果我用的是火花

00:02:25.850 --> 00:02:29.120
如果我很習慣使用
Python，那太好了。

00:02:29.120 --> 00:02:30.770
但如果我更像一個SQL的人，

00:02:30.770 --> 00:02:33.320
那麼也許我想連接
到相同的資料集，

00:02:33.320 --> 00:02:36.040
我將運行群集
使用 SQL 語言。

00:02:36.040 --> 00:02:41.420
在這裡，我創建了外部
表上的檔案格式。

00:02:41.420 --> 00:02:43.870
這是你
可以使用嚮導執行。

00:02:43.870 --> 00:02:45.250
我要到這兒去

00:02:45.250 --> 00:02:46.930
從 CSV 檔創建外部表。

00:02:46.930 --> 00:02:50.315
然後，這將創建此
我使用的外部表。

00:02:50.315 --> 00:02:52.415
但在這種情況下，我已經
使用代碼完成。

00:02:52.415 --> 00:02:56.500
如果我擊中運行單元，

00:02:56.500 --> 00:02:59.765
你可以看到，我也使用SQL

00:02:59.765 --> 00:03:03.625
訪問與
我剛剛使用 Spark 訪問。

00:03:03.625 --> 00:03:07.410
現在，這些檔是
保存為 IPYNB 檔，

00:03:07.410 --> 00:03:10.970
然後，我可以與我分享
同事和我可以再次運行。

00:03:10.970 --> 00:03:14.465
所以，在這種情況下，我
今天想運行這個

00:03:14.465 --> 00:03:15.995
把它寄給我的同事

00:03:15.995 --> 00:03:18.950
他們可以打開它
在他們的瞬間和

00:03:18.950 --> 00:03:20.480
將其附加到自己的群集或

00:03:20.480 --> 00:03:22.535
到我的同一群集，並再次運行它。

00:03:22.535 --> 00:03:24.800
我們還在使用筆記本
在其他一些方面。

00:03:24.800 --> 00:03:27.485
在這裡，我們有一些東西
被稱為木星書。

00:03:27.485 --> 00:03:30.710
這是一個基本筆記本的清單

00:03:30.710 --> 00:03:34.130
已經編譯在一起
成章節頁面格式。

00:03:34.130 --> 00:03:37.775
因此，在這裡，我們有一個SQL
伺服器 ML 服務課程，

00:03:37.775 --> 00:03:40.985
通過筆記本顯示。

00:03:40.985 --> 00:03:43.070
因此，我們已經得到了所有
文檔。

00:03:43.070 --> 00:03:46.445
我們拿到了代碼示例
在這裡，然後你可以，

00:03:46.445 --> 00:03:47.780
在每章的末尾，

00:03:47.780 --> 00:03:49.730
要麼打下一個
按鈕轉到下一個

00:03:49.730 --> 00:03:52.400
一個或使用本章
瀏覽器選擇它。

00:03:52.400 --> 00:03:54.965
我們還得到了
支援性書

00:03:54.965 --> 00:03:57.255
用於 SQL Server 2019
大資料群集。

00:03:57.255 --> 00:03:59.210
如果我提出
命令引導和選取

00:03:59.210 --> 00:04:01.160
這個木星書2019指南，

00:04:01.160 --> 00:04:03.035
這就是我用來打開這個。

00:04:03.035 --> 00:04:05.960
在這裡，我們有所有的
資訊，你可能

00:04:05.960 --> 00:04:08.885
需要支援
您的新大資料群集，

00:04:08.885 --> 00:04:11.585
很多庫伯內特斯命令
群集資訊。

00:04:11.585 --> 00:04:13.565
這是你可以運行的東西，

00:04:13.565 --> 00:04:14.735
你可以寄給別人

00:04:14.735 --> 00:04:17.065
你可以保存和
做你想做的。

00:04:17.065 --> 00:04:21.140
因此，我們非常興奮
Azure 資料工作室中的筆記本。

00:04:21.140 --> 00:04:23.210
我們真的認為
是的東西，將

00:04:23.210 --> 00:04:26.210
對我們的社區非常有用。

00:04:26.210 --> 00:04:28.040
我們真的很感興趣
在找出如何

00:04:28.040 --> 00:04:29.765
你用它和
你想從我們這裡得到什麼

00:04:29.765 --> 00:04:32.800
所以如果你有興趣
瞭解更多，轉到 GitHub，

00:04:32.800 --> 00:04:34.610
查找 Azure 資料工作室，您

00:04:34.610 --> 00:04:37.120
可以打開功能
請求錯誤之間。

00:04:37.120 --> 00:04:39.470
這也是你
可以同時下載

00:04:39.470 --> 00:04:51.991
穩定和內部加。
非常感謝你的時間。

00:04:51.991 --> 00:04:57.040
[ 音樂]

