WEBVTT

00:00:00.000 --> 00:00:03.070
• SQL 伺服器 2019 大
資料群集提供

00:00:03.070 --> 00:00:04.950
要優化的資料池

00:00:04.950 --> 00:00:07.905
達到查詢性能
到多個來源。

00:00:07.905 --> 00:00:10.080
烏馬漢達爾在這裡
我們今天告訴我們所有

00:00:10.080 --> 00:00:12.450
關於它今天的資料暴露。

00:00:12.450 --> 00:00:23.550
[音樂]。

00:00:23.550 --> 00:00:26.250
• 嗨，歡迎來到另一個
一集資料暴露。

00:00:26.250 --> 00:00:29.100
我是你的東道主傑琳
今天，我們有你看到我們

00:00:29.100 --> 00:00:32.085
談論資料池
在 SQL 大資料群集中。

00:00:32.085 --> 00:00:33.675
嗨，烏馬漢達爾歡迎參加這個節目。

00:00:33.675 --> 00:00:35.460
嗨，我很高興來到這裡。

00:00:35.460 --> 00:00:38.160
* 因此，資料池
大資料群集。

00:00:38.160 --> 00:00:40.505
這是什麼？我需要知道什麼？

00:00:40.505 --> 00:00:42.440
當然，是的，讓我快速開始

00:00:42.440 --> 00:00:45.110
通過顯示什麼
大資料群集是。

00:00:45.110 --> 00:00:48.090
因此，此幻燈片顯示了

00:00:48.090 --> 00:00:52.110
SQL 伺服器 19 大資料
集群和今天，我們

00:00:52.110 --> 00:00:56.360
要談論資料
這裡池，這是基本上

00:00:56.360 --> 00:00:59.300
兩個 SQL 伺服器實例，可以是

00:00:59.300 --> 00:01:02.960
用於卸載一些
查詢 [聽不到]。

00:01:02.960 --> 00:01:04.810
因此，讓我們看看什麼是資料池。

00:01:04.810 --> 00:01:08.390
因此，它基本上是 SQL 伺服器
存儲和計算

00:01:08.390 --> 00:01:13.550
提供來編寫查詢
並將資料存儲在資料池中。

00:01:13.550 --> 00:01:16.310
它可以通過運行操作

00:01:16.310 --> 00:01:20.900
一些外部表操作
並在它，你填充資料

00:01:20.900 --> 00:01:24.440
進入資料池和
以後，你實際上可以

00:01:24.440 --> 00:01:28.970
卸載一些分析
查詢到此資料池。

00:01:28.970 --> 00:01:32.400
因此，這是主要
資料池的用途。

00:01:32.400 --> 00:01:37.140
所以，現在讓我們可能快速採取
看看一些方案。

00:01:37.140 --> 00:01:39.980
所以常見的情況是，你

00:01:39.980 --> 00:01:42.710
獲取資料
不同的資料來源，

00:01:42.710 --> 00:01:44.570
其中一些速度很快，

00:01:44.570 --> 00:01:47.345
其他人在性質上是較慢的。

00:01:47.345 --> 00:01:51.050
所以，現在你想基本上優化

00:01:51.050 --> 00:01:55.535
此查詢，以便您可以
實際上採取該查詢

00:01:55.535 --> 00:02:00.350
並將結果存儲在
資料池，這允許您

00:02:00.350 --> 00:02:02.900
基本上使用，像

00:02:02.900 --> 00:02:07.300
一個過渡區，在那裡你
可以運行所有分析。

00:02:07.300 --> 00:02:10.830
另一個例子是，如果你
做機器學習，

00:02:10.830 --> 00:02:12.830
有很多
方案，你

00:02:12.830 --> 00:02:14.960
將生成功能
和數百和

00:02:14.960 --> 00:02:18.290
數以千計的功能和
你想基本上存儲

00:02:18.290 --> 00:02:23.040
資料集在
你可以做重複分析。

00:02:23.040 --> 00:02:26.145
那是另一個地方
資料池有説明。

00:02:26.145 --> 00:02:29.540
* 所以在這種情況下，它不是
僅用於查詢優化

00:02:29.540 --> 00:02:31.190
也為了確保
你不必去

00:02:31.190 --> 00:02:32.975
返回資料來源
一直都是，對吧？

00:02:32.975 --> 00:02:33.230
* 是。

00:02:33.230 --> 00:02:34.385
• 如果要重複使用資料。

00:02:34.385 --> 00:02:34.625
* 是的。

00:02:34.625 --> 00:02:35.660
• 酷，聽起來很酷。

00:02:35.660 --> 00:02:37.355
所以，你真的可以
告訴我們這是如何運作的？

00:02:37.355 --> 00:02:40.550
是的，我們快走
來評估這裡有多少

00:02:40.550 --> 00:02:42.230
所以我這裡有

00:02:42.230 --> 00:02:45.530
與 SQL 的連接
伺服器大資料群集。

00:02:45.530 --> 00:02:48.890
我連接到 SQL
伺服器主實例。

00:02:48.890 --> 00:02:51.905
因此，創建資料池的方法

00:02:51.905 --> 00:02:55.625
是首先通過創建
此資料來源物件。

00:02:55.625 --> 00:02:58.100
因此，這裡，因為這個名稱表明

00:02:58.100 --> 00:03:01.325
在這裡，這基本上說什麼
資料來源的類型。

00:03:01.325 --> 00:03:04.400
然後我要
連接到資料池。

00:03:04.400 --> 00:03:05.530
"好的。

00:03:05.530 --> 00:03:08.780
• 就是這樣
創建它。在那之後

00:03:08.780 --> 00:03:11.360
定義表
你想

00:03:11.360 --> 00:03:13.940
存儲在資料中
池和，這完成了

00:03:13.940 --> 00:03:16.670
通過運行此外部
表語句。

00:03:16.670 --> 00:03:17.845
"好的。

00:03:17.845 --> 00:03:21.090
• 這看起來像您的常規
創建表語句，

00:03:21.090 --> 00:03:24.110
有列
你需要定義和

00:03:24.110 --> 00:03:27.725
添加，因為有許多 SQL
後端上的伺服器實例。

00:03:27.725 --> 00:03:28.115
* 正確。

00:03:28.115 --> 00:03:30.740
你只需要說你
想要分發資料。

00:03:30.740 --> 00:03:32.630
所以，有了這個，你可以告訴，好吧，

00:03:32.630 --> 00:03:36.155
所以我們得到了一個偶數或近似
均勻分佈。

00:03:36.155 --> 00:03:36.515
* 是的。

00:03:36.515 --> 00:03:37.400
• 在整個服務。

00:03:37.400 --> 00:03:37.685
* 是。

00:03:37.685 --> 00:03:38.000
"好的。

00:03:38.000 --> 00:03:41.330
• 這就是迴圈
做基本上是分發

00:03:41.330 --> 00:03:44.825
資料跨越多少
您擁有的資料池實例。

00:03:44.825 --> 00:03:45.865
"好的。

00:03:45.865 --> 00:03:49.370
• 下一件事你可以
做就像查詢資料一樣。

00:03:49.370 --> 00:03:50.780
因此，讓我們先看看一些

00:03:50.780 --> 00:03:54.155
示例資料
這個例子，我有在

00:03:54.155 --> 00:03:57.680
HDFS 目錄和基本

00:03:57.680 --> 00:04:00.155
我想拿這些
點選流資料，

00:04:00.155 --> 00:04:04.490
執行一些查詢並填充
到資料池中。

00:04:04.490 --> 00:04:08.915
你這樣做的方式是
只運行插入語句。

00:04:08.915 --> 00:04:13.490
因此，插入的來源
語句只是一個 SQL 查詢，

00:04:13.490 --> 00:04:18.140
你可以簡單地運行
查詢並填充資料。

00:04:18.140 --> 00:04:21.320
我不會跑過
插入，但讓我們快速

00:04:21.320 --> 00:04:25.205
查看已出現的資料
在資料池中填充。

00:04:25.205 --> 00:04:28.445
因此，此查詢應返回
大約2000排，對吧？

00:04:28.445 --> 00:04:32.930
所以，現在就像任何其他
表，你實際上可以加入

00:04:32.930 --> 00:04:37.460
此表與其他表
在 SQL Server 中，獲取

00:04:37.460 --> 00:04:39.680
結果和透明

00:04:39.680 --> 00:04:42.200
此 SQL Server 實例
將要談談

00:04:42.200 --> 00:04:47.555
要運行的資料池實例
查詢並獲取結果。

00:04:47.555 --> 00:04:50.330
所以這是在一個較高的水準
資料池是什麼。

00:04:50.330 --> 00:04:51.530
• 酷真棒。

00:04:51.530 --> 00:04:54.390
這令人印象深刻。
非常感謝

00:04:54.390 --> 00:04:55.530
• 酷，謝謝。

00:04:55.530 --> 00:04:58.050
"好的。所以謝謝你的收看。

00:04:58.050 --> 00:04:59.590
請喜歡和訂閱，

00:04:59.590 --> 00:05:02.150
視頻評論
如果你想我們

00:05:02.150 --> 00:05:06.360
記錄別的東西和希望
下次見你謝謝。

00:05:06.360 --> 00:05:20.860
[音樂]

