WEBVTT

00:00:00.000 --> 00:00:10.470
[音樂]。

00:00:10.470 --> 00:00:11.730
嗨，我是羅尼·查特吉。

00:00:11.730 --> 00:00:15.150
我是高級產品經理
微軟的 Azure 資料團隊，

00:00:15.150 --> 00:00:16.710
我很高興加入

00:00:16.710 --> 00:00:18.450
史蒂文·德魯克 從
微軟研究。

00:00:18.450 --> 00:00:20.400
* 是。嗨，我是史蒂文·德魯克

00:00:20.400 --> 00:00:23.550
我是一個研究員，我
管理我們的視覺化效果

00:00:23.550 --> 00:00:26.700
和互動式資料分析
微軟研究團隊。

00:00:26.700 --> 00:00:28.620
* 所以今天，我們是
將顯示一些

00:00:28.620 --> 00:00:31.560
資料視覺化
使用沙舞的經驗。

00:00:31.560 --> 00:00:33.345
所以在我們開始之前，史蒂夫

00:00:33.345 --> 00:00:36.690
動機是什麼
用於建造[聽不見]。

00:00:36.690 --> 00:00:40.685
* 所以我們看著
視覺化大量事物

00:00:40.685 --> 00:00:42.620
和一件事，驅使我

00:00:42.620 --> 00:00:45.095
瘋狂的是，這是非常
容易得到一個聚合，

00:00:45.095 --> 00:00:46.850
摘要，但摘要

00:00:46.850 --> 00:00:49.010
離開了很多
個別的事情。

00:00:49.010 --> 00:00:50.930
所以我們看著
如何真正看

00:00:50.930 --> 00:00:52.790
個人資料，但

00:00:52.790 --> 00:00:54.815
仍然有它組織
在整體意義上。

00:00:54.815 --> 00:00:55.445
* 真棒。

00:00:55.445 --> 00:00:56.600
但這正是真正導致的原因。

00:00:56.600 --> 00:00:58.070
"好的。因此，讓我們開始，

00:00:58.070 --> 00:00:59.825
讓我們看看桑丹提供什麼。

00:00:59.825 --> 00:01:01.040
"好的。首先

00:01:01.040 --> 00:01:04.805
你可以去GitHub，看看
在沙丹就在那裡。

00:01:04.805 --> 00:01:08.420
您可以啟動
互動體驗在這裡，

00:01:08.420 --> 00:01:10.520
而我只是要切掉它，

00:01:10.520 --> 00:01:14.750
我們才剛剛開始尋找
在資料經驗。

00:01:14.750 --> 00:01:16.000
所以現在

00:01:16.000 --> 00:01:17.870
第一個經典資料集，我們

00:01:17.870 --> 00:01:20.060
看著很多是
泰坦尼克號資料集。

00:01:20.060 --> 00:01:21.920
在這裡，我們有大約2，200

00:01:21.920 --> 00:01:24.335
泰坦尼克號上的人
乘客和機組人員，

00:01:24.335 --> 00:01:25.730
你實際上可以看到它。

00:01:25.730 --> 00:01:28.010
這就像你會看到的
從 SQL 查詢，您

00:01:28.010 --> 00:01:30.890
只要看看所有的數位
不會組織。

00:01:30.890 --> 00:01:33.185
那不會給你
大量的資訊。

00:01:33.185 --> 00:01:34.730
但其中一件事
你可能想要

00:01:34.730 --> 00:01:36.320
做你可能想說好，

00:01:36.320 --> 00:01:39.630
誰倖存下來
泰坦尼克號，誰沒有？

00:01:39.630 --> 00:01:39.885
• 哇。

00:01:39.885 --> 00:01:43.095
• 你可以看到所有這些東西
移動到位置，並得到那些。

00:01:43.095 --> 00:01:45.330
* 所以大約約 1，500？

00:01:45.330 --> 00:01:48.270
是的，大約有1500人死亡

00:01:48.270 --> 00:01:50.660
所以它是關於雙
倖存下來的人數。

00:01:50.660 --> 00:01:52.535
這就像一個
第三和三分之二。

00:01:52.535 --> 00:01:54.020
太驚人了

00:01:54.020 --> 00:01:54.425
* 是的。

00:01:54.425 --> 00:01:56.690
* 所以
我喜歡做的事情是

00:01:56.690 --> 00:01:58.880
我喜歡讓我們
添加一點顏色。

00:01:58.880 --> 00:02:02.020
所以我要著色這個基於
在泰坦尼克號上倖存下來的人

00:02:02.020 --> 00:02:04.280
你可以看到
自然綠色和紅色，

00:02:04.280 --> 00:02:07.110
但你可以選擇
任何你想要的託盤。

00:02:07.180 --> 00:02:09.410
那不是真的
顯示任何其他內容，

00:02:09.410 --> 00:02:11.330
但現在我可以選擇
只是人，

00:02:11.330 --> 00:02:13.490
活下來了，我可以孤立他們。

00:02:13.490 --> 00:02:15.410
我這麼做是因為
我想看看他們跟著

00:02:15.410 --> 00:02:17.690
婦女和兒童
第一范式？

00:02:17.690 --> 00:02:20.150
所以，現在我們只是看
倖存下來的人

00:02:20.150 --> 00:02:22.910
現在我要改變
只是樞軸，只是說，

00:02:22.910 --> 00:02:26.095
讓我們按性別看。

00:02:26.095 --> 00:02:29.460
所以我們可以選擇性別，
你可以說

00:02:29.460 --> 00:02:32.990
哇，大約是同一個數位
女人和男人倖存下來。

00:02:32.990 --> 00:02:34.340
我不會相信嗎？

00:02:34.340 --> 00:02:35.330
我不知道

00:02:35.330 --> 00:02:36.980
是的，很震撼。

00:02:36.980 --> 00:02:39.410
他們沒聽懂嗎？

00:02:39.410 --> 00:02:41.990
實際上，如果我們停止

00:02:41.990 --> 00:02:44.865
過濾，我們實際上看到
所有的人，你可以說，

00:02:44.865 --> 00:02:46.550
是的，絕對數量的男人

00:02:46.550 --> 00:02:48.350
或婦女倖存下來是大致相同，

00:02:48.350 --> 00:02:50.510
但有更多的男人
在泰坦尼克號上比女人。

00:02:50.510 --> 00:02:53.210
所以我的百分比，你
男人相當糟糕。

00:02:53.210 --> 00:02:54.830
但這不是全部

00:02:54.830 --> 00:02:56.180
我們也可以正視這一點。

00:02:56.180 --> 00:02:58.280
我們實際上可以做
四個不同的繪圖

00:02:58.280 --> 00:03:00.200
基於什麼艙位
類，他們在。

00:03:00.200 --> 00:03:01.880
所以，如果我們只是點擊，

00:03:01.880 --> 00:03:05.250
"艙艙類"在這裡，你可以
現在我們有頭等艙

00:03:05.250 --> 00:03:06.840
二等，三等船員。

00:03:06.840 --> 00:03:08.850
在頭等艙裡，沒有很多女人死了

00:03:08.850 --> 00:03:10.275
他們真的很好。

00:03:10.275 --> 00:03:12.705
二等，有點差。

00:03:12.705 --> 00:03:15.420
但第三類，他們
做相當糟糕。

00:03:15.420 --> 00:03:18.090
所以這裡說的是
在泰坦尼克號

00:03:18.090 --> 00:03:19.890
做一個有錢的女人是有説明的

00:03:19.890 --> 00:03:22.800
生存了一點點更好。
但是孩子們呢？

00:03:22.800 --> 00:03:25.170
因此，讓我們改變，而不是
看性別，

00:03:25.170 --> 00:03:27.810
讓我們簡單地改變這個年齡。

00:03:27.810 --> 00:03:30.530
現在，我們可以打破這一點的權利

00:03:30.530 --> 00:03:32.795
現在在這個年齡是一個
有點分散。

00:03:32.795 --> 00:03:34.175
現在我們有0-10

00:03:34.175 --> 00:03:36.230
你可以看到在0-10，

00:03:36.230 --> 00:03:37.475
你可以看到在頭等艙，

00:03:37.475 --> 00:03:39.380
只有一個孩子死了

00:03:39.380 --> 00:03:42.305
在第二類中，沒有
孩子死了

00:03:42.305 --> 00:03:45.290
在三等班，超過一半的人死了。

00:03:45.290 --> 00:03:48.020
我很好奇，我們可以
實際上放大到這一點。

00:03:48.020 --> 00:03:51.365
我們實際上可以放大
說這個人是誰？

00:03:51.365 --> 00:03:54.270
那是海倫·洛林夫人
愛麗絲，我們可以點擊她。

00:03:54.270 --> 00:03:56.210
一件好東西
這實際上是被掛的

00:03:56.210 --> 00:03:58.130
你可以到
單個資料點，

00:03:58.130 --> 00:04:00.995
她找她，並
對她做個事

00:04:00.995 --> 00:04:05.315
原來有些東西
叫做《泰坦尼克號百科全書》

00:04:05.315 --> 00:04:07.145
我不知道有

00:04:07.145 --> 00:04:09.470
但你會發現洛林·安森

00:04:09.470 --> 00:04:11.750
是獨生子女在第一
和二等人死亡。

00:04:11.750 --> 00:04:14.420
事實證明，
父母從

00:04:14.420 --> 00:04:17.420
孩子和弟弟

00:04:17.420 --> 00:04:19.160
他們發誓不離開

00:04:19.160 --> 00:04:21.305
泰坦尼克號，直到
全家人都在一起

00:04:21.305 --> 00:04:22.700
但事實證明
仍然有採取

00:04:22.700 --> 00:04:24.080
弟弟早點走。

00:04:24.080 --> 00:04:26.900
所以她是唯一的孩子
死在一等和二等。

00:04:26.900 --> 00:04:29.345
但是76名兒童中有53個死亡。

00:04:29.345 --> 00:04:32.075
它真的可以説明你人性化
資料，理解。

00:04:32.075 --> 00:04:32.465
* 是的。

00:04:32.465 --> 00:04:35.060
* 所以這只是一種
這裡的許多故事。

00:04:35.060 --> 00:04:37.130
還有很多其他的故事
你可以得到這個。

00:04:37.130 --> 00:04:40.370
因此，例如，另一個
你可以找到的是

00:04:40.370 --> 00:04:44.035
有一種方法，看看這
基於人們支付多少。

00:04:44.035 --> 00:04:47.940
讓我關掉面
在那裡，"臉"，"無"。

00:04:47.940 --> 00:04:50.630
所以在這裡，如果我們真的改變

00:04:50.630 --> 00:04:53.330
這樣，讓我們來看看
人們付出的代價

00:04:53.330 --> 00:04:55.775
票，然後我們如果我們

00:04:55.775 --> 00:04:58.760
顏色，這由什麼機艙
類，他們結束了，

00:04:58.760 --> 00:05:00.155
你會看到一些有趣的模式。

00:05:00.155 --> 00:05:02.450
所以首先，你可以
看到它真的很大。

00:05:02.450 --> 00:05:05.525
你付了很多錢
你獲得一流的。

00:05:05.525 --> 00:05:06.440
* 正確。

00:05:06.440 --> 00:05:07.760
[ ] 然後第二類是

00:05:07.760 --> 00:05:10.265
這個橙色的東西，然後
第三類是這個東西。

00:05:10.265 --> 00:05:11.660
事實證明，
船員沒有顯示

00:05:11.660 --> 00:05:12.725
起來，因為他們根本不付錢。

00:05:12.725 --> 00:05:13.070
* 正確。

00:05:13.070 --> 00:05:14.300
但是當我看到這個的時候

00:05:14.300 --> 00:05:17.075
我注意到這個奇怪的
異常在那裡。

00:05:17.075 --> 00:05:18.800
讓我們進入
小角落在這裡。

00:05:18.800 --> 00:05:20.180
如果我能開過去

00:05:20.180 --> 00:05:22.700
就像這個人沒有
付出很多錢。

00:05:22.700 --> 00:05:25.190
發生什麼事了？
這個人是誰？

00:05:25.190 --> 00:05:27.620
弗朗斯·奧拉夫·卡爾森先生是誰？

00:05:27.620 --> 00:05:29.750
同樣，我們可以做同樣的
事情，你只是點擊

00:05:29.750 --> 00:05:32.825
他，我們可以得到一些
關於他的資訊。

00:05:32.825 --> 00:05:34.490
如果你帶他來，我不會這麼做

00:05:34.490 --> 00:05:35.930
我告訴你
打孔線現在。

00:05:35.930 --> 00:05:37.310
事實證明，他是船長

00:05:37.310 --> 00:05:39.140
和泰坦尼克號一樣的線路

00:05:39.140 --> 00:05:41.405
哦，哇，這很有趣。

00:05:41.405 --> 00:05:43.295
• 有罷工和

00:05:43.295 --> 00:05:45.560
他的船沒有運行，所以
他們不可能是船長

00:05:45.560 --> 00:05:47.540
所以他們把他運來
在泰坦尼克號上

00:05:47.540 --> 00:05:48.650
他不必付錢
任何它為

00:05:48.650 --> 00:05:49.925
他的票稅。

00:05:49.925 --> 00:05:51.875
原來他死在泰坦尼克號上

00:05:51.875 --> 00:05:53.990
所以這傢伙是雙倍的不幸。

00:05:53.990 --> 00:05:56.975
他不可能是船長
他不能做任何事情

00:05:56.975 --> 00:05:57.490
* 是的。

00:05:57.490 --> 00:05:59.220
• 這裡還有一個異常，

00:05:59.220 --> 00:06:00.780
這傢伙在幹什麼？

00:06:00.780 --> 00:06:03.155
他沒付那麼多錢嗎？

00:06:03.155 --> 00:06:06.740
作為第二類
乘客，但他是藍色的。

00:06:06.740 --> 00:06:07.130
[ ] 好的。

00:06:07.130 --> 00:06:08.495
所以頭等艙
發生什麼事了？

00:06:08.495 --> 00:06:10.310
所以，如果我們點擊這個人，

00:06:10.310 --> 00:06:12.560
努爾尼先生，再次，

00:06:12.560 --> 00:06:13.730
我們可以去找他

00:06:13.730 --> 00:06:16.070
原來，先生
努爾尼被安置了

00:06:16.070 --> 00:06:19.910
再次通過舊的百科全書
泰坦尼克拉，回來

00:06:19.910 --> 00:06:27.300
他被安排在二等和
他不喜歡他的小屋

00:06:27.300 --> 00:06:30.290
所以我們去抱怨，
他們升級他在船上。

00:06:30.290 --> 00:06:32.360
他只是不得不支付
升級費用，如船舶

00:06:32.360 --> 00:06:34.520
這就是為什麼它沒有顯示
在原來的車道。

00:06:34.520 --> 00:06:36.530
事實證明，因為他是在

00:06:36.530 --> 00:06:39.680
頭等艙或也許不是
因為他活了下來

00:06:39.680 --> 00:06:41.690
所以它只是告訴你
有時它

00:06:41.690 --> 00:06:44.360
説明抱怨，也許
你最終活下來了

00:06:44.360 --> 00:06:46.760
非常感謝您給我們看

00:06:46.760 --> 00:06:50.550
跨越的很多經驗
與沙丹提供。

00:06:50.560 --> 00:06:54.830
告訴我們更多關於什麼
是跨產品

00:06:54.830 --> 00:06:57.770
微軟利用
這美麗的技術

00:06:57.770 --> 00:06:59.445
在 MSR 中構建的沙舞。

00:06:59.445 --> 00:07:00.630
[ ] 所以現在，

00:07:00.630 --> 00:07:02.385
它在 Azure 資料工作室中工作，

00:07:02.385 --> 00:07:05.010
電源 BI，它的工作原理
作為自訂視覺物件。

00:07:05.010 --> 00:07:05.670
* 非常好。

00:07:05.670 --> 00:07:07.610
* 你可以試試
直接在網路上與

00:07:07.610 --> 00:07:09.890
您自己的資料，它不
甚至被上傳到雲，

00:07:09.890 --> 00:07:11.330
它只是在本地運行該資料。

00:07:11.330 --> 00:07:13.340
所以，你可以只看看你的
自己的資料集。

00:07:13.340 --> 00:07:15.230
當然，如果你想
做更多的事情，

00:07:15.230 --> 00:07:17.030
它有助於將其上傳到雲。

00:07:17.030 --> 00:07:19.820
我們看著將軍
外掛程式體系結構。

00:07:19.820 --> 00:07:22.910
我們在視覺化方面做了很多工作
機器學習模型。

00:07:22.910 --> 00:07:25.250
* 是的，您還構建
在VS代碼，以及，對不對？

00:07:25.250 --> 00:07:26.720
* 是的，確切地說。

00:07:26.720 --> 00:07:28.070
它已合併到 VS 代碼中。

00:07:28.070 --> 00:07:30.320
所以，再次，這整個
現在在做的方式

00:07:30.320 --> 00:07:34.205
開源擴展到現有
產品思維一個可插拔，

00:07:34.205 --> 00:07:37.010
真的很令人興奮自
我，這是一個新世界。

00:07:37.010 --> 00:07:39.875
我來過這裡
微軟近25年

00:07:39.875 --> 00:07:43.730
和只是能量，
你現在看到

00:07:43.730 --> 00:07:45.800
得到的東西在那裡
供人們嘗試

00:07:45.800 --> 00:07:47.975
並修改獲取拉
請求並添加到其中。

00:07:47.975 --> 00:07:49.265
• 太神奇了。

00:07:49.265 --> 00:07:51.275
那麼，桑丹的下一步呢？

00:07:51.275 --> 00:07:52.700
* 有很多
事情。首先

00:07:52.700 --> 00:07:54.320
有很多功能請求。

00:07:54.320 --> 00:07:57.140
所以有各種各樣的事情。

00:07:57.140 --> 00:07:59.240
人們將要添加
圖像這些東西，

00:07:59.240 --> 00:08:00.905
不同類型的佈局。

00:08:00.905 --> 00:08:04.280
我做了很多機器學習和
可解釋性視覺化。

00:08:04.280 --> 00:08:06.140
因此，我們看看自訂
這樣做的方式，

00:08:06.140 --> 00:08:08.600
掛鉤，在專案中稱為模型

00:08:08.600 --> 00:08:10.460
跟蹤器，我們可以視覺化，

00:08:10.460 --> 00:08:13.565
相同的個人和聚合。

00:08:13.565 --> 00:08:15.530
我們以講故事的方式做。

00:08:15.530 --> 00:08:17.450
所以有一堆
專案

00:08:17.450 --> 00:08:19.850
只是他們如何告訴一堆
關於泰坦尼克號的故事

00:08:19.850 --> 00:08:21.770
但泰坦尼克號不是
必然的故事

00:08:21.770 --> 00:08:22.990
你總是想告訴。

00:08:22.990 --> 00:08:26.270
講述關於您的
相關資料或資料。

00:08:26.270 --> 00:08:28.160
它只是飼料到很多

00:08:28.160 --> 00:08:29.840
其他視覺化
專案

00:08:29.840 --> 00:08:31.830
繼續研究
和在公司。

00:08:31.830 --> 00:08:33.440
* 非常好。所以謝謝你

00:08:33.440 --> 00:08:35.885
大家聽
今天加入我們。

00:08:35.885 --> 00:08:38.570
很高興有
你史蒂夫今天加入我們

00:08:38.570 --> 00:08:41.410
和桑丹玩，

00:08:41.410 --> 00:08:43.070
和走來走去和GitHub和

00:08:43.070 --> 00:08:45.095
探索你能做什麼
資料頂部。

00:08:45.095 --> 00:08:46.550
非常感謝你
聽今天。

00:08:46.550 --> 00:08:46.910
謝謝

00:08:46.910 --> 00:09:01.630
[音樂]

