WEBVTT

00:00:09.680 --> 00:00:10.780
[ 音乐]

00:00:10.780 --> 00:00:12.750
[ ] 嗨。我是薇琪·哈普
SQL Server 产品团队。

00:00:12.750 --> 00:00:15.870
我今天在这里告诉你
笔记本和 Azure 数据工作室。

00:00:15.870 --> 00:00:18.825
因此，笔记本是一个概念

00:00:18.825 --> 00:00:20.660
数据科学

00:00:20.660 --> 00:00:22.940
用来做很多
数据可视化，

00:00:22.940 --> 00:00:25.010
数据勘探和数据工作，

00:00:25.010 --> 00:00:26.855
主要是在Python语言中。

00:00:26.855 --> 00:00:28.760
当人们说话时
关于笔记本，

00:00:28.760 --> 00:00:30.485
很多时候，我们谈论
关于木星笔记本。

00:00:30.485 --> 00:00:32.660
因此，笔记本的实现

00:00:32.660 --> 00:00:34.730
我们在 Azure 数据工作室中是

00:00:34.730 --> 00:00:37.070
木星笔记本与
自定义前端

00:00:37.070 --> 00:00:40.430
更好地定制，以适应
Azure 数据工作室体验。

00:00:40.430 --> 00:00:45.450
所以首先，我要展示
你一个简单的Python笔记本。

00:00:45.450 --> 00:00:46.760
这是一个笔记本，具有

00:00:46.760 --> 00:00:49.250
Python 语言和
你可以看到我们已经得到了

00:00:49.250 --> 00:00:51.620
一节在这里，这是

00:00:51.620 --> 00:00:54.395
人类可读的文本和
下面有代码的节。

00:00:54.395 --> 00:00:56.149
所以，如果我击中运行这个，

00:00:56.149 --> 00:00:58.010
这个特殊的代码调用

00:00:58.010 --> 00:01:00.755
互联网和拉下一个
随机拍摄的狗。

00:01:00.755 --> 00:01:03.710
向您展示
笔记本体验，

00:01:03.710 --> 00:01:05.390
我们这里有个采摘机

00:01:05.390 --> 00:01:06.770
我们可以选择语言。

00:01:06.770 --> 00:01:08.630
所以在这种情况下，我
运行 Python 3，

00:01:08.630 --> 00:01:10.475
我运行它
在我的本地机器上。

00:01:10.475 --> 00:01:13.460
我可以搬到
语言 SQL，然后

00:01:13.460 --> 00:01:16.430
选择哪个 MySQL 服务器
我想连接到的机器。

00:01:16.430 --> 00:01:18.605
我在此处列出了 MySQL 服务器。

00:01:18.605 --> 00:01:21.830
所以再往前走一点，

00:01:21.830 --> 00:01:24.230
我给你举个例子
如何使用这个。

00:01:24.230 --> 00:01:28.025
所以在这里我有一个SQL服务器
2019 大数据集群

00:01:28.025 --> 00:01:32.555
是 SQL 服务器在库伯内特斯运行
SQL 和 Spark。

00:01:32.555 --> 00:01:34.490
所以在我的 HDFS 部分，

00:01:34.490 --> 00:01:38.040
我拿到了这个目录
充满了CSV文件。

00:01:38.040 --> 00:01:40.890
如果我看一下，预览它，

00:01:40.890 --> 00:01:42.260
你可以看到，这是很多

00:01:42.260 --> 00:01:44.780
关于狗的信息
许可证信息。

00:01:44.780 --> 00:01:46.970
因此，这实际上是数据转储

00:01:46.970 --> 00:01:48.320
宾夕法尼亚的阿莱格尼县

00:01:48.320 --> 00:01:51.230
狗许可证
持续几年。

00:01:51.230 --> 00:01:55.775
因此，使用火花
语言和连接

00:01:55.775 --> 00:02:00.440
到 Python 使用 Spark 上
SQL 服务器大数据群集。

00:02:00.440 --> 00:02:02.045
我能跑

00:02:02.045 --> 00:02:05.780
代码读取这些文件
直接退出 CSV。

00:02:05.780 --> 00:02:07.760
然后我可以做一些分析。

00:02:07.760 --> 00:02:09.890
所以在这种情况下，我要
获取行的计数。

00:02:09.890 --> 00:02:15.645
我要列出不同的
列表只是名字，

00:02:15.645 --> 00:02:17.215
所以我们有25，000个名字

00:02:17.215 --> 00:02:20.825
然后，我要拉一个
随机的名字，从帽子。

00:02:20.825 --> 00:02:22.550
因此，我们有一个名字在这里。

00:02:22.550 --> 00:02:25.850
现在，如果我用的是火花

00:02:25.850 --> 00:02:29.120
如果我很习惯使用
Python，那太好了。

00:02:29.120 --> 00:02:30.770
但如果我更像一个SQL的人，

00:02:30.770 --> 00:02:33.320
那么也许我想连接
到相同的数据集，

00:02:33.320 --> 00:02:36.040
我将运行群集
使用 SQL 语言。

00:02:36.040 --> 00:02:41.420
在这里，我创建了外部
表上的文件格式。

00:02:41.420 --> 00:02:43.870
这是你
可以使用向导执行。

00:02:43.870 --> 00:02:45.250
我要到这儿去

00:02:45.250 --> 00:02:46.930
从 CSV 文件创建外部表。

00:02:46.930 --> 00:02:50.315
然后，这将创建此
我使用的外部表。

00:02:50.315 --> 00:02:52.415
但在这种情况下，我已经
使用代码完成。

00:02:52.415 --> 00:02:56.500
如果我击中运行单元，

00:02:56.500 --> 00:02:59.765
你可以看到，我也使用SQL

00:02:59.765 --> 00:03:03.625
访问与
我刚刚使用 Spark 访问。

00:03:03.625 --> 00:03:07.410
现在，这些文件是
保存为 IPYNB 文件，

00:03:07.410 --> 00:03:10.970
然后，我可以与我分享
同事和我可以再次运行。

00:03:10.970 --> 00:03:14.465
所以，在这种情况下，我
今天想运行这个

00:03:14.465 --> 00:03:15.995
把它寄给我的同事

00:03:15.995 --> 00:03:18.950
他们可以打开它
在他们的瞬间和

00:03:18.950 --> 00:03:20.480
将其附加到自己的群集或

00:03:20.480 --> 00:03:22.535
到我的同一群集，并再次运行它。

00:03:22.535 --> 00:03:24.800
我们还在使用笔记本
在其他一些方面。

00:03:24.800 --> 00:03:27.485
在这里，我们有一些东西
被称为木星书。

00:03:27.485 --> 00:03:30.710
这是一个基本笔记本的列表

00:03:30.710 --> 00:03:34.130
已经编译在一起
成章节页面格式。

00:03:34.130 --> 00:03:37.775
因此，在这里，我们有一个SQL
服务器 ML 服务课程，

00:03:37.775 --> 00:03:40.985
通过笔记本显示。

00:03:40.985 --> 00:03:43.070
因此，我们已经得到了所有
文档。

00:03:43.070 --> 00:03:46.445
我们拿到了代码示例
在这里，然后你可以，

00:03:46.445 --> 00:03:47.780
在每章的末尾，

00:03:47.780 --> 00:03:49.730
要么打下一个
按钮转到下一个

00:03:49.730 --> 00:03:52.400
一个或使用本章
浏览器选择它。

00:03:52.400 --> 00:03:54.965
我们还得到了
支持性书

00:03:54.965 --> 00:03:57.255
用于 SQL Server 2019
大数据群集。

00:03:57.255 --> 00:03:59.210
如果我提出
命令引导和选取

00:03:59.210 --> 00:04:01.160
这个木星书2019指南，

00:04:01.160 --> 00:04:03.035
这就是我用来打开这个。

00:04:03.035 --> 00:04:05.960
在这里，我们有所有的
信息，你可能

00:04:05.960 --> 00:04:08.885
需要支持
您的新大数据群集，

00:04:08.885 --> 00:04:11.585
很多库伯内特斯命令
群集信息。

00:04:11.585 --> 00:04:13.565
这是你可以运行的东西，

00:04:13.565 --> 00:04:14.735
你可以寄给别人

00:04:14.735 --> 00:04:17.065
你可以保存和
做你想做的。

00:04:17.065 --> 00:04:21.140
因此，我们非常兴奋
Azure 数据工作室中的笔记本。

00:04:21.140 --> 00:04:23.210
我们真的认为
是的东西，将

00:04:23.210 --> 00:04:26.210
对我们的社区非常有用。

00:04:26.210 --> 00:04:28.040
我们真的很感兴趣
在找出如何

00:04:28.040 --> 00:04:29.765
你用它和
你想从我们这里得到什么

00:04:29.765 --> 00:04:32.800
所以如果你有兴趣
了解更多，转到 GitHub，

00:04:32.800 --> 00:04:34.610
查找 Azure 数据工作室，您

00:04:34.610 --> 00:04:37.120
可以打开功能
请求错误之间。

00:04:37.120 --> 00:04:39.470
这也是你
可以同时下载

00:04:39.470 --> 00:04:51.991
稳定和内部加。
非常感谢你的时间。

00:04:51.991 --> 00:04:57.040
[ 音乐]

