WEBVTT

00:00:00.000 --> 00:00:10.470
[音乐]。

00:00:10.470 --> 00:00:11.730
嗨，我是罗尼·查特吉。

00:00:11.730 --> 00:00:15.150
我是高级产品经理
微软的 Azure 数据团队，

00:00:15.150 --> 00:00:16.710
我很高兴加入

00:00:16.710 --> 00:00:18.450
史蒂文·德鲁克 从
微软研究。

00:00:18.450 --> 00:00:20.400
* 是。嗨，我是史蒂文·德鲁克

00:00:20.400 --> 00:00:23.550
我是一个研究员，我
管理我们的可视化效果

00:00:23.550 --> 00:00:26.700
和交互式数据分析
微软研究团队。

00:00:26.700 --> 00:00:28.620
* 所以今天，我们是
将显示一些

00:00:28.620 --> 00:00:31.560
数据可视化
使用沙舞的经验。

00:00:31.560 --> 00:00:33.345
所以在我们开始之前，史蒂夫

00:00:33.345 --> 00:00:36.690
动机是什么
用于建造[听不见]。

00:00:36.690 --> 00:00:40.685
* 所以我们看着
可视化大量事物

00:00:40.685 --> 00:00:42.620
和一件事，驱使我

00:00:42.620 --> 00:00:45.095
疯狂的是，这是非常
容易得到一个聚合，

00:00:45.095 --> 00:00:46.850
摘要，但摘要

00:00:46.850 --> 00:00:49.010
离开了很多
个别的事情。

00:00:49.010 --> 00:00:50.930
所以我们看着
如何真正看

00:00:50.930 --> 00:00:52.790
个人数据，但

00:00:52.790 --> 00:00:54.815
仍然有它组织
在整体意义上。

00:00:54.815 --> 00:00:55.445
* 真棒。

00:00:55.445 --> 00:00:56.600
但这正是真正导致的原因。

00:00:56.600 --> 00:00:58.070
"好的。因此，让我们开始，

00:00:58.070 --> 00:00:59.825
让我们看看桑丹提供什么。

00:00:59.825 --> 00:01:01.040
"好的。首先

00:01:01.040 --> 00:01:04.805
你可以去GitHub，看看
在沙丹就在那里。

00:01:04.805 --> 00:01:08.420
您可以启动
互动体验在这里，

00:01:08.420 --> 00:01:10.520
而我只是要切掉它，

00:01:10.520 --> 00:01:14.750
我们才刚刚开始寻找
在数据经验。

00:01:14.750 --> 00:01:16.000
所以现在

00:01:16.000 --> 00:01:17.870
第一个经典数据集，我们

00:01:17.870 --> 00:01:20.060
看着很多是
泰坦尼克号数据集。

00:01:20.060 --> 00:01:21.920
在这里，我们有大约2，200

00:01:21.920 --> 00:01:24.335
泰坦尼克号上的人
乘客和机组人员，

00:01:24.335 --> 00:01:25.730
你实际上可以看到它。

00:01:25.730 --> 00:01:28.010
这就像你会看到的
从 SQL 查询，您

00:01:28.010 --> 00:01:30.890
只要看看所有的数字
不会组织。

00:01:30.890 --> 00:01:33.185
那不会给你
大量的信息。

00:01:33.185 --> 00:01:34.730
但其中一件事
你可能想要

00:01:34.730 --> 00:01:36.320
做你可能想说好，

00:01:36.320 --> 00:01:39.630
谁幸存下来
泰坦尼克号，谁没有？

00:01:39.630 --> 00:01:39.885
• 哇。

00:01:39.885 --> 00:01:43.095
• 你可以看到所有这些东西
移动到位置，并得到那些。

00:01:43.095 --> 00:01:45.330
* 所以大约约 1，500？

00:01:45.330 --> 00:01:48.270
是的，大约有1500人死亡

00:01:48.270 --> 00:01:50.660
所以它是关于双
幸存下来的人数。

00:01:50.660 --> 00:01:52.535
这就像一个
第三和三分之二。

00:01:52.535 --> 00:01:54.020
太惊人了

00:01:54.020 --> 00:01:54.425
* 是的。

00:01:54.425 --> 00:01:56.690
* 所以
我喜欢做的事情是

00:01:56.690 --> 00:01:58.880
我喜欢让我们
添加一点颜色。

00:01:58.880 --> 00:02:02.020
所以我要着色这个基于
在泰坦尼克号上幸存下来的人

00:02:02.020 --> 00:02:04.280
你可以看到
自然绿色和红色，

00:02:04.280 --> 00:02:07.110
但你可以选择
任何你想要的托盘。

00:02:07.180 --> 00:02:09.410
那不是真的
显示任何其他内容，

00:02:09.410 --> 00:02:11.330
但现在我可以选择
只是人，

00:02:11.330 --> 00:02:13.490
活下来了，我可以孤立他们。

00:02:13.490 --> 00:02:15.410
我这么做是因为
我想看看他们跟着

00:02:15.410 --> 00:02:17.690
妇女和儿童
第一范式？

00:02:17.690 --> 00:02:20.150
所以，现在我们只是看
幸存下来的人

00:02:20.150 --> 00:02:22.910
现在我要改变
只是枢轴，只是说，

00:02:22.910 --> 00:02:26.095
让我们按性别看。

00:02:26.095 --> 00:02:29.460
所以我们可以选择性别，
你可以说

00:02:29.460 --> 00:02:32.990
哇，大约是同一个数字
女人和男人幸存下来。

00:02:32.990 --> 00:02:34.340
我不会相信吗？

00:02:34.340 --> 00:02:35.330
我不知道

00:02:35.330 --> 00:02:36.980
是的，很震撼。

00:02:36.980 --> 00:02:39.410
他们没听懂吗？

00:02:39.410 --> 00:02:41.990
实际上，如果我们停止

00:02:41.990 --> 00:02:44.865
过滤，我们实际上看到
所有的人，你可以说，

00:02:44.865 --> 00:02:46.550
是的，绝对数量的男人

00:02:46.550 --> 00:02:48.350
或妇女幸存下来是大致相同，

00:02:48.350 --> 00:02:50.510
但有更多的男人
在泰坦尼克号上比女人。

00:02:50.510 --> 00:02:53.210
所以我的百分比，你
男人相当糟糕。

00:02:53.210 --> 00:02:54.830
但这不是全部

00:02:54.830 --> 00:02:56.180
我们也可以正视这一点。

00:02:56.180 --> 00:02:58.280
我们实际上可以做
四个不同的绘图

00:02:58.280 --> 00:03:00.200
基于什么舱位
类，他们在。

00:03:00.200 --> 00:03:01.880
所以，如果我们只是点击，

00:03:01.880 --> 00:03:05.250
"舱舱类"在这里，你可以
现在我们有头等舱

00:03:05.250 --> 00:03:06.840
二等，三等船员。

00:03:06.840 --> 00:03:08.850
在头等舱里，没有很多女人死了

00:03:08.850 --> 00:03:10.275
他们真的很好。

00:03:10.275 --> 00:03:12.705
二等，有点差。

00:03:12.705 --> 00:03:15.420
但第三类，他们
做相当糟糕。

00:03:15.420 --> 00:03:18.090
所以这里说的是
在泰坦尼克号

00:03:18.090 --> 00:03:19.890
做一个有钱的女人是有帮助的

00:03:19.890 --> 00:03:22.800
生存了一点点更好。
但是孩子们呢？

00:03:22.800 --> 00:03:25.170
因此，让我们改变，而不是
看性别，

00:03:25.170 --> 00:03:27.810
让我们简单地改变这个年龄。

00:03:27.810 --> 00:03:30.530
现在，我们可以打破这一点的权利

00:03:30.530 --> 00:03:32.795
现在在这个年龄是一个
有点分散。

00:03:32.795 --> 00:03:34.175
现在我们有0-10

00:03:34.175 --> 00:03:36.230
你可以看到在0-10，

00:03:36.230 --> 00:03:37.475
你可以看到在头等舱，

00:03:37.475 --> 00:03:39.380
只有一个孩子死了

00:03:39.380 --> 00:03:42.305
在第二类中，没有
孩子死了

00:03:42.305 --> 00:03:45.290
在三等班，超过一半的人死了。

00:03:45.290 --> 00:03:48.020
我很好奇，我们可以
实际上放大到这一点。

00:03:48.020 --> 00:03:51.365
我们实际上可以放大
说这个人是谁？

00:03:51.365 --> 00:03:54.270
那是海伦·洛林夫人
爱丽丝，我们可以点击她。

00:03:54.270 --> 00:03:56.210
一件好东西
这实际上是被挂的

00:03:56.210 --> 00:03:58.130
你可以到
单个数据点，

00:03:58.130 --> 00:04:00.995
她找她，并
对她做个事

00:04:00.995 --> 00:04:05.315
原来有些东西
叫做《泰坦尼克号百科全书》

00:04:05.315 --> 00:04:07.145
我不知道有

00:04:07.145 --> 00:04:09.470
但你会发现洛林·安森

00:04:09.470 --> 00:04:11.750
是独生子女在第一
和二等人死亡。

00:04:11.750 --> 00:04:14.420
事实证明，
父母从

00:04:14.420 --> 00:04:17.420
孩子和弟弟

00:04:17.420 --> 00:04:19.160
他们发誓不离开

00:04:19.160 --> 00:04:21.305
泰坦尼克号，直到
全家人都在一起

00:04:21.305 --> 00:04:22.700
但事实证明
仍然有采取

00:04:22.700 --> 00:04:24.080
弟弟早点走。

00:04:24.080 --> 00:04:26.900
所以她是唯一的孩子
死在一等和二等。

00:04:26.900 --> 00:04:29.345
但是76名儿童中有53个死亡。

00:04:29.345 --> 00:04:32.075
它真的可以帮助你人性化
数据，理解。

00:04:32.075 --> 00:04:32.465
* 是的。

00:04:32.465 --> 00:04:35.060
* 所以这只是一种
这里的许多故事。

00:04:35.060 --> 00:04:37.130
还有很多其他的故事
你可以得到这个。

00:04:37.130 --> 00:04:40.370
因此，例如，另一个
你可以找到的是

00:04:40.370 --> 00:04:44.035
有一种方法，看看这
基于人们支付多少。

00:04:44.035 --> 00:04:47.940
让我关掉面
在那里，"脸"，"无"。

00:04:47.940 --> 00:04:50.630
所以在这里，如果我们真的改变

00:04:50.630 --> 00:04:53.330
这样，让我们来看看
人们付出的代价

00:04:53.330 --> 00:04:55.775
票，然后我们如果我们

00:04:55.775 --> 00:04:58.760
颜色，这由什么机舱
类，他们结束了，

00:04:58.760 --> 00:05:00.155
你会看到一些有趣的模式。

00:05:00.155 --> 00:05:02.450
所以首先，你可以
看到它真的很大。

00:05:02.450 --> 00:05:05.525
你付了很多钱
你获得一流的。

00:05:05.525 --> 00:05:06.440
* 正确。

00:05:06.440 --> 00:05:07.760
[ ] 然后第二类是

00:05:07.760 --> 00:05:10.265
这个橙色的东西，然后
第三类是这个东西。

00:05:10.265 --> 00:05:11.660
事实证明，
船员没有显示

00:05:11.660 --> 00:05:12.725
起来，因为他们根本不付钱。

00:05:12.725 --> 00:05:13.070
* 正确。

00:05:13.070 --> 00:05:14.300
但是当我看到这个的时候

00:05:14.300 --> 00:05:17.075
我注意到这个奇怪的
异常在那里。

00:05:17.075 --> 00:05:18.800
让我们进入
小角落在这里。

00:05:18.800 --> 00:05:20.180
如果我能开过去

00:05:20.180 --> 00:05:22.700
就像这个人没有
付出很多钱。

00:05:22.700 --> 00:05:25.190
发生什么事了？
这个人是谁？

00:05:25.190 --> 00:05:27.620
弗朗斯·奥拉夫·卡尔森先生是谁？

00:05:27.620 --> 00:05:29.750
同样，我们可以做同样的
事情，你只是点击

00:05:29.750 --> 00:05:32.825
他，我们可以得到一些
关于他的信息。

00:05:32.825 --> 00:05:34.490
如果你带他来，我不会这么做

00:05:34.490 --> 00:05:35.930
我告诉你
打孔线现在。

00:05:35.930 --> 00:05:37.310
事实证明，他是船长

00:05:37.310 --> 00:05:39.140
和泰坦尼克号一样的线路

00:05:39.140 --> 00:05:41.405
哦，哇，这很有趣。

00:05:41.405 --> 00:05:43.295
• 有罢工和

00:05:43.295 --> 00:05:45.560
他的船没有运行，所以
他们不可能是船长

00:05:45.560 --> 00:05:47.540
所以他们把他运来
在泰坦尼克号上

00:05:47.540 --> 00:05:48.650
他不必付钱
任何它为

00:05:48.650 --> 00:05:49.925
他的票税。

00:05:49.925 --> 00:05:51.875
原来他死在泰坦尼克号上

00:05:51.875 --> 00:05:53.990
所以这家伙是双倍的不幸。

00:05:53.990 --> 00:05:56.975
他不可能是船长
他不能做任何事情

00:05:56.975 --> 00:05:57.490
* 是的。

00:05:57.490 --> 00:05:59.220
• 这里还有一个异常，

00:05:59.220 --> 00:06:00.780
这家伙在干什么？

00:06:00.780 --> 00:06:03.155
他没付那么多钱吗？

00:06:03.155 --> 00:06:06.740
作为第二类
乘客，但他是蓝色的。

00:06:06.740 --> 00:06:07.130
[ ] 好的。

00:06:07.130 --> 00:06:08.495
所以头等舱
发生什么事了？

00:06:08.495 --> 00:06:10.310
所以，如果我们点击这个人，

00:06:10.310 --> 00:06:12.560
努尔尼先生，再次，

00:06:12.560 --> 00:06:13.730
我们可以去找他

00:06:13.730 --> 00:06:16.070
原来，先生
努尔尼被安置了

00:06:16.070 --> 00:06:19.910
再次通过旧的百科全书
泰坦尼克拉，回来

00:06:19.910 --> 00:06:27.300
他被安排在二等和
他不喜欢他的小屋

00:06:27.300 --> 00:06:30.290
所以我们去抱怨，
他们升级他在船上。

00:06:30.290 --> 00:06:32.360
他只是不得不支付
升级费用，如船舶

00:06:32.360 --> 00:06:34.520
这就是为什么它没有显示
在原来的车道。

00:06:34.520 --> 00:06:36.530
事实证明，因为他是在

00:06:36.530 --> 00:06:39.680
头等舱或也许不是
因为他活了下来

00:06:39.680 --> 00:06:41.690
所以它只是告诉你
有时它

00:06:41.690 --> 00:06:44.360
帮助抱怨，也许
你最终活下来了

00:06:44.360 --> 00:06:46.760
非常感谢您给我们看

00:06:46.760 --> 00:06:50.550
跨越的很多经验
与沙丹提供。

00:06:50.560 --> 00:06:54.830
告诉我们更多关于什么
是跨产品

00:06:54.830 --> 00:06:57.770
微软利用
这美丽的技术

00:06:57.770 --> 00:06:59.445
在 MSR 中构建的沙舞。

00:06:59.445 --> 00:07:00.630
[ ] 所以现在，

00:07:00.630 --> 00:07:02.385
它在 Azure 数据工作室中工作，

00:07:02.385 --> 00:07:05.010
电源 BI，它的工作原理
作为自定义视觉对象。

00:07:05.010 --> 00:07:05.670
* 非常好。

00:07:05.670 --> 00:07:07.610
* 你可以试试
直接在网络上与

00:07:07.610 --> 00:07:09.890
您自己的数据，它不
甚至被上传到云，

00:07:09.890 --> 00:07:11.330
它只是在本地运行该数据。

00:07:11.330 --> 00:07:13.340
所以，你可以只看看你的
自己的数据集。

00:07:13.340 --> 00:07:15.230
当然，如果你想
做更多的事情，

00:07:15.230 --> 00:07:17.030
它有助于将其上传到云。

00:07:17.030 --> 00:07:19.820
我们看着将军
插件体系结构。

00:07:19.820 --> 00:07:22.910
我们在可视化方面做了很多工作
机器学习模型。

00:07:22.910 --> 00:07:25.250
* 是的，您还构建
在VS代码，以及，对不对？

00:07:25.250 --> 00:07:26.720
* 是的，确切地说。

00:07:26.720 --> 00:07:28.070
它已合并到 VS 代码中。

00:07:28.070 --> 00:07:30.320
所以，再次，这整个
现在在做的方式

00:07:30.320 --> 00:07:34.205
开源扩展到现有
产品思维一个可插拔，

00:07:34.205 --> 00:07:37.010
真的很令人兴奋自
我，这是一个新世界。

00:07:37.010 --> 00:07:39.875
我来过这里
微软近25年

00:07:39.875 --> 00:07:43.730
和只是能量，
你现在看到

00:07:43.730 --> 00:07:45.800
得到的东西在那里
供人们尝试

00:07:45.800 --> 00:07:47.975
并修改获取拉
请求并添加到其中。

00:07:47.975 --> 00:07:49.265
• 太神奇了。

00:07:49.265 --> 00:07:51.275
那么，桑丹的下一步呢？

00:07:51.275 --> 00:07:52.700
* 有很多
事情。首先

00:07:52.700 --> 00:07:54.320
有很多功能请求。

00:07:54.320 --> 00:07:57.140
所以有各种各样的事情。

00:07:57.140 --> 00:07:59.240
人们将要添加
图像这些东西，

00:07:59.240 --> 00:08:00.905
不同类型的布局。

00:08:00.905 --> 00:08:04.280
我做了很多机器学习和
可解释性可视化。

00:08:04.280 --> 00:08:06.140
因此，我们看看自定义
这样做的方式，

00:08:06.140 --> 00:08:08.600
挂钩，在项目中称为模型

00:08:08.600 --> 00:08:10.460
跟踪器，我们可以可视化，

00:08:10.460 --> 00:08:13.565
相同的个人和聚合。

00:08:13.565 --> 00:08:15.530
我们以讲故事的方式做。

00:08:15.530 --> 00:08:17.450
所以有一堆
项目

00:08:17.450 --> 00:08:19.850
只是他们如何告诉一堆
关于泰坦尼克号的故事

00:08:19.850 --> 00:08:21.770
但泰坦尼克号不是
必然的故事

00:08:21.770 --> 00:08:22.990
你总是想告诉。

00:08:22.990 --> 00:08:26.270
讲述关于您的
相关数据或数据。

00:08:26.270 --> 00:08:28.160
它只是饲料到很多

00:08:28.160 --> 00:08:29.840
其他可视化
项目

00:08:29.840 --> 00:08:31.830
继续研究
和在公司。

00:08:31.830 --> 00:08:33.440
* 非常好。所以谢谢你

00:08:33.440 --> 00:08:35.885
大家听
今天加入我们。

00:08:35.885 --> 00:08:38.570
很高兴有
你史蒂夫今天加入我们

00:08:38.570 --> 00:08:41.410
和桑丹玩，

00:08:41.410 --> 00:08:43.070
和走来走去和GitHub和

00:08:43.070 --> 00:08:45.095
探索你能做什么
数据顶部。

00:08:45.095 --> 00:08:46.550
非常感谢你
听今天。

00:08:46.550 --> 00:08:46.910
谢谢

00:08:46.910 --> 00:09:01.630
[音乐]

