WEBVTT

00:00:09.680 --> 00:00:10.780
>> [音楽]。

00:00:10.780 --> 00:00:12.750
>> こんにちは。私はヴィッキー・ハープと
SQL Server 製品チーム。

00:00:12.750 --> 00:00:15.870
今日お見せしに来ました
ノートブックと Azure データ スタジオ。

00:00:15.870 --> 00:00:18.825
だからノートブックは、

00:00:18.825 --> 00:00:20.660
データサイエンスは、

00:00:20.660 --> 00:00:22.940
多くのことを行うために使用される
データビジュアライゼーション,

00:00:22.940 --> 00:00:25.010
データ探索とデータ作業、

00:00:25.010 --> 00:00:26.855
主に Python 言語で。

00:00:26.855 --> 00:00:28.760
人々が話しているとき
ノートブックについて,

00:00:28.760 --> 00:00:30.485
私たちが話している多くの時間
木星ノートブックについて。

00:00:30.485 --> 00:00:32.660
だから、ノートブックの実装

00:00:32.660 --> 00:00:34.730
Azure データ スタジオに用意されているものは、

00:00:34.730 --> 00:00:37.070
木星のノートブック
カスタムフロントエンド

00:00:37.070 --> 00:00:40.430
内に収まるようにより良い調整
Azure データ スタジオエクスペリエンス。

00:00:40.430 --> 00:00:45.450
だから、まず、私は表示するつもりです
あなたは簡単なPythonノートブック。

00:00:45.450 --> 00:00:46.760
これは、持っているノートブックです

00:00:46.760 --> 00:00:49.250
Python 言語と
あなたは私たちが持っているのを見ることができます

00:00:49.250 --> 00:00:51.620
ここのセクションは

00:00:51.620 --> 00:00:54.395
人間が読み取り可能なテキストと
ここにコードがあるセクションがあります。

00:00:54.395 --> 00:00:56.149
だから私がこの上で実行をヒットした場合、

00:00:56.149 --> 00:00:58.010
この特定のコードは、

00:00:58.010 --> 00:01:00.755
インターネットを引き下げる
犬のランダムな写真。

00:01:00.755 --> 00:01:03.710
の周りにあなたを表示するには
ノートブックの経験,

00:01:03.710 --> 00:01:05.390
ここにピッカーがある

00:01:05.390 --> 00:01:06.770
私たちは言語を選択することができます。

00:01:06.770 --> 00:01:08.630
だから、この場合、私は
Python 3 を実行しています,

00:01:08.630 --> 00:01:10.475
そして私はそれを実行しています
私のローカルマシンで。

00:01:10.475 --> 00:01:13.460
私は代わりに移動することができます
言語 SQL およびその後

00:01:13.460 --> 00:01:16.430
MySQL サーバーの選択
取り付けたい機械。

00:01:16.430 --> 00:01:18.605
ここに MySQL サーバーがリストされています。

00:01:18.605 --> 00:01:21.830
もう少し詳しく言えば

00:01:21.830 --> 00:01:24.230
例を見せてあげよう
これをどのように使用するかについて説明します。

00:01:24.230 --> 00:01:28.025
だから、私はここでSQLサーバーを持っている
2019年のビッグデータクラスタ

00:01:28.025 --> 00:01:32.555
は Kubernetes で実行されている SQL Server です。
SQL と Spark の両方を使用します。

00:01:32.555 --> 00:01:34.490
だから私のHDFSセクションで、

00:01:34.490 --> 00:01:38.040
このディレクトリを手に入れました
CSV ファイルがいっぱいです。

00:01:38.040 --> 00:01:40.890
見てみると プレビューして

00:01:40.890 --> 00:01:42.260
あなたはそれが多くあることがわかります

00:01:42.260 --> 00:01:44.780
犬に関する情報
ライセンス情報。

00:01:44.780 --> 00:01:46.970
したがって、これは実際にデータ ダンプです。

00:01:46.970 --> 00:01:48.320
ペンシルベニア州アレゲニー郡

00:01:48.320 --> 00:01:51.230
犬のライセンス
最後の数年。

00:01:51.230 --> 00:01:55.775
だから、スパークを使用して
言語と接続

00:01:55.775 --> 00:02:00.440
上の Spark を使用して Python に
SQL サーバー ビッグ データ クラスタ。

00:02:00.440 --> 00:02:02.045
逃げるのよ

00:02:02.045 --> 00:02:05.780
これらのファイルを読み取るコード
CSV から直接出します。

00:02:05.780 --> 00:02:07.760
その後、私はいくつかの分析を行うことができます。

00:02:07.760 --> 00:02:09.890
だから、この場合、私は行くつもりです
行の数を取得します。

00:02:09.890 --> 00:02:15.645
私は明確なリストに入るつもりです
名前だけのリスト、

00:02:15.645 --> 00:02:17.215
25,000人の名前があります。

00:02:17.215 --> 00:02:20.825
その後、私は引っ張るつもりです
その帽子からランダムな名前。

00:02:20.825 --> 00:02:22.550
ここに名前があるの

00:02:22.550 --> 00:02:25.850
スパークを使ったら

00:02:25.850 --> 00:02:29.120
私は非常に使用に慣れていた場合
Python、それは素晴らしいことだ。

00:02:29.120 --> 00:02:30.770
しかし、私がSQLの人なら、

00:02:30.770 --> 00:02:33.320
その後、多分私は接続したい
同じデータセットに対して、

00:02:33.320 --> 00:02:36.040
私はクラスターを実行します
SQL 言語を使用します。

00:02:36.040 --> 00:02:41.420
ここでは、外部を作成しました
そのファイル形式のテーブル。

00:02:41.420 --> 00:02:43.870
これは、あなた
ウィザードを使用して実行できます。

00:02:43.870 --> 00:02:45.250
私はここに行くつもりです。

00:02:45.250 --> 00:02:46.930
CSV ファイルから外部テーブルを作成します。

00:02:46.930 --> 00:02:50.315
その後、これを作成します。
私が使用している外部テーブル。

00:02:50.315 --> 00:02:52.415
しかし、この場合、私は
コードを使用して行います。

00:02:52.415 --> 00:02:56.500
実行セルにヒットした場合、

00:02:56.500 --> 00:02:59.765
私もSQLを使用していることがわかります

00:02:59.765 --> 00:03:03.625
と同じデータにアクセスするには
私はちょうどSparkを使用してアクセスしました。

00:03:03.625 --> 00:03:07.410
さて、これらのファイルは
IPYNB ファイルとして保存され、

00:03:07.410 --> 00:03:10.970
私は私と共有することができます
同僚と私は再び実行することができます。

00:03:10.970 --> 00:03:14.465
だから、私の場合は
今日これを実行したかった

00:03:14.465 --> 00:03:15.995
同僚に送る

00:03:15.995 --> 00:03:18.950
彼らはそれを開くことができる
彼らの瞬間に

00:03:18.950 --> 00:03:20.480
独自のクラスタにアタッチするか、

00:03:20.480 --> 00:03:22.535
私の同じクラスタにし、再びそれを実行します。

00:03:22.535 --> 00:03:24.800
ノートブックも使用しています
いくつかの他の方法で。

00:03:24.800 --> 00:03:27.485
ここでは、我々は何かを持っている
木星の本と呼ばれる

00:03:27.485 --> 00:03:30.710
これは基本的にノートブックのリストです

00:03:30.710 --> 00:03:34.130
一緒にコンパイルされていた
チャプター ページ形式にします。

00:03:34.130 --> 00:03:37.775
だからここにSQLがあります
サーバー ML サービス コース,

00:03:37.775 --> 00:03:40.985
ノートブックを通じて表示されます。

00:03:40.985 --> 00:03:43.070
だから、私たちはすべてを持っています
ドキュメントが存在します。

00:03:43.070 --> 00:03:46.445
コードサンプルを手に入れました
ここへ来て、そして、あなたは、することができます

00:03:46.445 --> 00:03:47.780
各章の最後に、

00:03:47.780 --> 00:03:49.730
どちらかが次を打つ
次へ行くボタン

00:03:49.730 --> 00:03:52.400
この章を使用する
それを選ぶためにブラウザ。

00:03:52.400 --> 00:03:54.965
我々はまた、
サポートアビリティブック

00:03:54.965 --> 00:03:57.255
SQL Server 2019 用
ビッグ データ クラスタ。

00:03:57.255 --> 00:03:59.210
もし私が育てたら
コマンドパイロットとピック

00:03:59.210 --> 00:04:01.160
この木星の本2019ガイド,

00:04:01.160 --> 00:04:03.035
それは私がこれを開くために使用するものです。

00:04:03.035 --> 00:04:05.960
ここでは、すべての
お知りになる情報

00:04:05.960 --> 00:04:08.885
サポートする必要性
あなたの新しいビッグデータクラスタ、

00:04:08.885 --> 00:04:11.585
Kubernetes コマンドの多くは、
クラスタ情報。

00:04:11.585 --> 00:04:13.565
これはあなたが実行できるものです、

00:04:13.565 --> 00:04:14.735
他の人に送ることができます。

00:04:14.735 --> 00:04:17.065
そして、あなたは保存することができますし、
あなたが望むものを行う。

00:04:17.065 --> 00:04:21.140
だから私たちはとても興奮しています
Azure データ スタジオのノートブック。

00:04:21.140 --> 00:04:23.210
私たちは本当に、これを考えます
は、次のようになります。

00:04:23.210 --> 00:04:26.210
私たちのコミュニティに非常に有用です。

00:04:26.210 --> 00:04:28.040
私たちは本当に興味を持っています
方法を見つける

00:04:28.040 --> 00:04:29.765
あなたはそれを使用し、
あなたが私たちから欲しいもの。

00:04:29.765 --> 00:04:32.800
あなたが興味を持っているなら
詳細については、GitHub に移動し、

00:04:32.800 --> 00:04:34.610
Azure データ スタジオを探して、

00:04:34.610 --> 00:04:37.120
機能を開くことができる
バグ間を要求します。

00:04:37.120 --> 00:04:39.470
そこも君の居場所だ
両方をダウンロードできます。

00:04:39.470 --> 00:04:51.991
安定し、インサイダー追加。
お時間をいただきありがとうございました。

00:04:51.991 --> 00:04:57.040
>> [音楽]

