WEBVTT

00:00:00.000 --> 00:00:10.530
[音樂]。

00:00:10.530 --> 00:00:12.300
嗨，我是羅尼·查特吉

00:00:12.300 --> 00:00:15.180
我是高級產品經理
在 Azure 資料團隊中。

00:00:15.180 --> 00:00:17.190
我處理 SQL 伺服器產品和

00:00:17.190 --> 00:00:19.605
今天我很興奮
告訴你我們有什麼

00:00:19.605 --> 00:00:22.230
構建為數據
視覺化體驗

00:00:22.230 --> 00:00:25.410
在 Azure 資料工作室中。
讓我們開始吧。

00:00:25.410 --> 00:00:27.690
在 Azure 資料工作室中，

00:00:27.690 --> 00:00:31.965
你有一個產品，給你

00:00:31.965 --> 00:00:33.960
資料視覺化以及

00:00:33.960 --> 00:00:36.600
工作經驗工作
在任何地方，資料，

00:00:36.600 --> 00:00:38.970
它是否也是本地資料

00:00:38.970 --> 00:00:41.755
作為大資料群集中的資料。

00:00:41.755 --> 00:00:45.470
因此，在此添加 Azure
資料工作室，正如您所看到的，

00:00:45.470 --> 00:00:47.870
我有一個 SQL 資料庫邊緣和

00:00:47.870 --> 00:00:51.080
SQL 伺服器大資料
我連接到的群集。

00:00:51.080 --> 00:00:56.075
現在，在 Azure 資料工作室中
建立在擴展之上。

00:00:56.075 --> 00:00:59.300
所以其中一件事
Azure 資料工作室提供的是

00:00:59.300 --> 00:01:00.830
安裝能力

00:01:00.830 --> 00:01:03.830
任何擴展，你可能會
喜歡您的資料操作。

00:01:03.830 --> 00:01:06.155
所以在這裡，一個擴展
我們要

00:01:06.155 --> 00:01:08.830
安裝今天被稱為沙舞。

00:01:08.830 --> 00:01:12.035
沙丹是一個資料
視覺化體驗。

00:01:12.035 --> 00:01:15.050
它提供單位
資料的視覺化

00:01:15.050 --> 00:01:18.365
你想探索
和視覺化的沙舞。

00:01:18.365 --> 00:01:21.515
所以在這裡，我安裝
沙舞擴展，

00:01:21.515 --> 00:01:22.955
正如你所看到的，

00:01:22.955 --> 00:01:25.535
沙舞擴展
剛剛安裝。

00:01:25.535 --> 00:01:28.775
因此，讓我們回到
資料的位置。

00:01:28.775 --> 00:01:32.720
所以我有資料裡面
SQL 伺服器大資料群集。

00:01:32.720 --> 00:01:35.585
SQL 伺服器大資料
群集隨同

00:01:35.585 --> 00:01:38.330
具有大資料群集的 HDFS

00:01:38.330 --> 00:01:40.745
我們可以存儲
資料量大。

00:01:40.745 --> 00:01:44.510
我有一個這樣的資料
例如，存儲在 HDFS 中

00:01:44.510 --> 00:01:48.695
SQL 伺服器大資料
群集是 demovote.tsv。

00:01:48.695 --> 00:01:51.755
現在讓我們來看看
這些資料是什麼樣子的。

00:01:51.755 --> 00:01:54.230
所以，如果你做一個快速
預覽資料，

00:01:54.230 --> 00:01:58.040
資料集從 HDFS 打開，

00:01:58.040 --> 00:01:59.150
正如你所看到的，

00:01:59.150 --> 00:02:01.115
這只不過是投票資料。

00:02:01.115 --> 00:02:03.230
它有投票資料
在奧巴馬期間

00:02:03.230 --> 00:02:04.625
羅姆尼的時間範圍

00:02:04.625 --> 00:02:07.160
選舉發生
遍佈美國。

00:02:07.160 --> 00:02:11.540
現在，如果我必須處理這個
特定的資料集，並將其交給

00:02:11.540 --> 00:02:15.925
我的資料科學家實際上
從資料中有意義，

00:02:15.925 --> 00:02:18.010
他將不得不實際上
生成一些報告，

00:02:18.010 --> 00:02:19.265
以及他是否使用

00:02:19.265 --> 00:02:22.330
資料視覺化庫
結構查看它，

00:02:22.330 --> 00:02:24.845
或者他使用一些代碼

00:02:24.845 --> 00:02:27.695
實際視覺化
資料的外觀。

00:02:27.695 --> 00:02:29.509
但在 Azure 資料工作室中，

00:02:29.509 --> 00:02:33.170
我們有我們的右鍵點擊
在沙舞中選擇視圖。

00:02:33.170 --> 00:02:36.070
讓我們來看看如何
這些資料看起來像。

00:02:36.070 --> 00:02:39.705
現在，你可以看到
沙舞正在載入，

00:02:39.705 --> 00:02:42.525
和沙丹實際上
自動探索

00:02:42.525 --> 00:02:45.480
這些資料有緯度

00:02:45.480 --> 00:02:47.765
經度，和散佈圖將

00:02:47.765 --> 00:02:51.140
最佳圖表選擇
繪製此特定資料。

00:02:51.140 --> 00:02:55.610
因此，我們有一個推薦人圖表
類型建在沙舞。

00:02:55.610 --> 00:02:57.395
所以，現在這個資料看起來不錯。

00:02:57.395 --> 00:02:59.300
我可以看到地圖
美國，

00:02:59.300 --> 00:03:01.040
如預期的那樣，因為投票資料，

00:03:01.040 --> 00:03:03.590
並具有 X 軸和
y 軸。

00:03:03.590 --> 00:03:07.640
現在，我仍然不知道是否有

00:03:07.640 --> 00:03:10.220
更多資訊，
資料，我可以

00:03:10.220 --> 00:03:13.760
顯然過濾在
X 軸和 y 軸，

00:03:13.760 --> 00:03:16.760
但會不是很好，如果我
可以實際繪製這個

00:03:16.760 --> 00:03:19.085
一個三維空間，實際上

00:03:19.085 --> 00:03:21.935
看看哪一個可能是
最好的分類器。

00:03:21.935 --> 00:03:26.085
因此，讓我們製作此圖
一個三維的。

00:03:26.085 --> 00:03:28.620
所以，如果我點擊"沙舞"，如果我

00:03:28.620 --> 00:03:31.575
按一下"三維"
一個，"現在我有z軸。

00:03:31.575 --> 00:03:35.840
現在在z軸，我可以
選擇收入，看看

00:03:35.840 --> 00:03:38.015
整個美國什麼

00:03:38.015 --> 00:03:40.715
收入人口統計
的人是。

00:03:40.715 --> 00:03:42.740
你可以看到
華盛頓做的很好

00:03:42.740 --> 00:03:44.855
特拉華州做的更好一點

00:03:44.855 --> 00:03:47.960
然後在紐約和
邁阿密也很棒。

00:03:47.960 --> 00:03:49.760
但是讓我們來看看

00:03:49.760 --> 00:03:51.725
就房屋中值而言，

00:03:51.725 --> 00:03:53.180
價格怎麼樣？

00:03:53.180 --> 00:03:56.840
你可以看到，圖形
自動調整自己。

00:03:56.840 --> 00:04:02.045
你也可以有一個各種
可以使用的顏色架構。

00:04:02.045 --> 00:04:04.580
所以我實際上可以看到，收入，

00:04:04.580 --> 00:04:06.230
你可以看到，我可以選擇

00:04:06.230 --> 00:04:09.380
不同的顏色架構
實際著色的圖形。

00:04:09.380 --> 00:04:13.325
我也可以很容易地
更改裝箱計數大小。

00:04:13.325 --> 00:04:17.030
所以你可以看到
我改變垃圾箱計數

00:04:17.030 --> 00:04:20.380
圖形動態
只是完全改變。

00:04:20.380 --> 00:04:22.130
現在這很好。

00:04:22.130 --> 00:04:24.865
我還可以視覺化資料，

00:04:24.865 --> 00:04:27.850
放大縮小字體功能 放大縮小字體功能

00:04:27.850 --> 00:04:32.440
我想看看資料
設置是給我一些方式

00:04:32.440 --> 00:04:34.165
在那裡我可以預測

00:04:34.165 --> 00:04:37.445
一些異常，如果
資料中的存在。

00:04:37.445 --> 00:04:40.880
所以，現在，讓我們開始做
在資料之上進行一些搜索。

00:04:40.880 --> 00:04:46.455
所以我要搜索
收入低於

00:04:46.455 --> 00:04:52.829
說 $40，000，也
添加另一個運算式，

00:04:52.829 --> 00:04:59.675
說，中位數的家值
超過80萬美元

00:04:59.675 --> 00:05:02.205
這似乎是一個很好的檢查。

00:05:02.205 --> 00:05:04.230
讓我們看看我們能否找到
一些資料集

00:05:04.230 --> 00:05:06.975
實際上滿足了這種需求。

00:05:06.975 --> 00:05:10.170
現在，如果我真的這樣做
搜索和選擇，

00:05:10.170 --> 00:05:12.260
你可以看到
桑丹有幾個

00:05:12.260 --> 00:05:14.660
資料點
實際上拿起它。

00:05:14.660 --> 00:05:17.210
這些顯示在圖形中。

00:05:17.210 --> 00:05:20.080
我可以很容易地隔離
這些資料點，

00:05:20.080 --> 00:05:21.860
現在我只是

00:05:21.860 --> 00:05:24.275
這四個子集
要考慮的資料點。

00:05:24.275 --> 00:05:26.570
你可以看到，有一個人在

00:05:26.570 --> 00:05:29.825
聖米格爾縣誰
買了房子

00:05:29.825 --> 00:05:35.710
812，500美元，收入為39 070美元。

00:05:35.710 --> 00:05:39.830
所以桑丹斯實際上給
單位視覺化

00:05:39.830 --> 00:05:43.985
您嘗試探索的資料
並從資料中有意義。

00:05:43.985 --> 00:05:46.220
您也可以做其他事情

00:05:46.220 --> 00:05:49.440
喜歡你可以採取
圖片的快照，

00:05:49.440 --> 00:05:51.150
您想要創建快照視圖，

00:05:51.150 --> 00:05:53.919
實際上，您可以創建一個快照，

00:05:56.720 --> 00:05:59.690
並創建快照視圖。

00:05:59.690 --> 00:06:02.630
現在，您可以嵌入此
文檔中的快照視圖

00:06:02.630 --> 00:06:04.160
你想
可能把它發送到

00:06:04.160 --> 00:06:05.945
別人採取
看看，以及。

00:06:05.945 --> 00:06:08.330
這就是我們提供的方式

00:06:08.330 --> 00:06:10.400
在

00:06:10.400 --> 00:06:12.635
正在操作的資料。

00:06:12.635 --> 00:06:16.880
現在，也是
我們添加的東西

00:06:16.880 --> 00:06:22.925
沙丹內部是能力
以視覺化查詢結果。

00:06:22.925 --> 00:06:26.060
所以在這裡我有一個
我創建的資料庫，

00:06:26.060 --> 00:06:30.020
在這個特定的資料庫中
我有一個感應器資料表。

00:06:30.020 --> 00:06:32.840
所以現在，如果我選擇一個1000

00:06:32.840 --> 00:06:35.705
從那個特別
表，我可以

00:06:35.705 --> 00:06:38.135
也點擊這個圖表

00:06:38.135 --> 00:06:41.839
在這裡，並載入此資料
沙舞作為視覺化檢視，

00:06:41.839 --> 00:06:44.495
雖然這只是感應器
資料，它沒有

00:06:44.495 --> 00:06:47.210
作為有趣的
投票資料，但仍然，

00:06:47.210 --> 00:06:50.360
這給了你一個快速的看法什麼

00:06:50.360 --> 00:06:54.655
資料視覺化
查詢的上下文可以像。

00:06:54.655 --> 00:06:57.025
現在在這個特殊的視頻中，

00:06:57.025 --> 00:07:00.035
你已經看到了我們是如何
使用沙舞實際上

00:07:00.035 --> 00:07:03.665
快速視覺化資料，使

00:07:03.665 --> 00:07:05.705
有意義的趨勢和理解

00:07:05.705 --> 00:07:07.190
趨勢是什麼正在發生

00:07:07.190 --> 00:07:09.140
資料，以便它可以説明你

00:07:09.140 --> 00:07:11.435
建設先進機器
學習演算法。

00:07:11.435 --> 00:07:13.100
非常感謝你
聽今天。

00:07:13.100 --> 00:07:27.910
[音樂]。

