WEBVTT

00:00:00.000 --> 00:00:10.530
[音楽]。

00:00:10.530 --> 00:00:12.300
>> こんにちは、私はロニー・チャタジーです、

00:00:12.300 --> 00:00:15.180
私はシニアプロダクトマネージャーです
を Azure データ チームに追加します。

00:00:15.180 --> 00:00:17.190
私はSQLサーバー製品に取り組み、

00:00:17.190 --> 00:00:19.605
今日は興奮している
私たちが持っているものをあなたに見せて

00:00:19.605 --> 00:00:22.230
データとして構築される
視覚化エクスペリエンス

00:00:22.230 --> 00:00:25.410
Azure データ スタジオで。
始めましょう。

00:00:25.410 --> 00:00:27.690
Azure データ スタジオでは、

00:00:27.690 --> 00:00:31.965
あなたはあなたに与える製品を持っています

00:00:31.965 --> 00:00:33.960
データビジュアライゼーションと

00:00:33.960 --> 00:00:36.600
仕事に経験がある
どこでもデータに対して、

00:00:36.600 --> 00:00:38.970
オンプレミスのデータかどうか

00:00:38.970 --> 00:00:41.755
ビッグ データ クラスター内のデータとして。

00:00:41.755 --> 00:00:45.470
だから、この Azure の追加で
ご覧のとおり、データスタジオは、

00:00:45.470 --> 00:00:47.870
私はSQLデータベースエッジを持っていると

00:00:47.870 --> 00:00:51.080
SQL Server ビッグ データ
私が接続しているクラスタ。

00:00:51.080 --> 00:00:56.075
さて、Azureデータスタジオでは、
拡張機能の上に構築されています。

00:00:56.075 --> 00:00:59.300
だから、ものの一つと
Azure データ スタジオが提供する

00:00:59.300 --> 00:01:00.830
インストールする機能

00:01:00.830 --> 00:01:03.830
あなたがするかもしれない任意の拡張子
データ操作に似ています。

00:01:03.830 --> 00:01:06.155
だからここで、拡張機能の一つ
私たちが行くつもりです

00:01:06.155 --> 00:01:08.830
今日のインストールはサンドダンスと呼ばれています。

00:01:08.830 --> 00:01:12.035
サンドダンスはデータです
視覚化の経験。

00:01:12.035 --> 00:01:15.050
それは単位を提供する
データの視覚化

00:01:15.050 --> 00:01:18.365
あなたが探検したいと思います
そしてサンドダンスで視覚化します。

00:01:18.365 --> 00:01:21.515
だからここで私はインストールしています
サンドダンスエクステンション,

00:01:21.515 --> 00:01:22.955
ご覧のとおり、

00:01:22.955 --> 00:01:25.535
サンドダンスエクステンション
がインストールされました。

00:01:25.535 --> 00:01:28.775
それでは、 に戻りましょう
データの場所。

00:01:28.775 --> 00:01:32.720
だから私は内部にデータを持っている
SQL Server ビッグ データ クラスタ。

00:01:32.720 --> 00:01:35.585
SQL Server ビッグ データ
クラスターが付属しています

00:01:35.585 --> 00:01:38.330
ビッグ データ クラスターを使用した HDFS

00:01:38.330 --> 00:01:40.745
私たちが保存できる場所
大量のデータ。

00:01:40.745 --> 00:01:44.510
私が持っているそのようなデータの1つ
例えばHDFSに保存される

00:01:44.510 --> 00:01:48.695
SQL Server ビッグ データの
クラスターはデモvote.tsvです。

00:01:48.695 --> 00:01:51.755
それでは、それでは見てみましょう
このデータの外観。

00:01:51.755 --> 00:01:54.230
だから、あなたが迅速に行う場合
データのプレビュー、

00:01:54.230 --> 00:01:58.040
データセットが HDFS から開きます。

00:01:58.040 --> 00:01:59.150
ご覧のとおり、

00:01:59.150 --> 00:02:01.115
これは投票データに過ぎません。

00:02:01.115 --> 00:02:03.230
投票データを持っています
オバマの間、

00:02:03.230 --> 00:02:04.625
のロムニー時間枠

00:02:04.625 --> 00:02:07.160
起こった選挙
全米で。

00:02:07.160 --> 00:02:11.540
さて、私はこれを処理する必要がある場合
特定のデータセットを与え、

00:02:11.540 --> 00:02:15.925
私のデータサイエンティストは実際に
データから意味をなす

00:02:15.925 --> 00:02:18.010
彼は実際にしなければならないだろう
いくつかのレポートを作成します。

00:02:18.010 --> 00:02:19.265
そして、彼が使用するかどうか

00:02:19.265 --> 00:02:22.330
データビジュアライゼーションライブラリ
それを見るための構造、

00:02:22.330 --> 00:02:24.845
または彼はいくつかのコードを使用します

00:02:24.845 --> 00:02:27.695
実際に視覚化する
データの外観。

00:02:27.695 --> 00:02:29.509
しかし、Azure データ スタジオでは、

00:02:29.509 --> 00:02:33.170
私たちは右クリックを持っています
サンドダンスでのビューのオプション。

00:02:33.170 --> 00:02:36.070
その方法を見てみましょう
このデータは次のようになります。

00:02:36.070 --> 00:02:39.705
さて、あなたはそれを見ることができます
サンドダンスが読み込み中です。

00:02:39.705 --> 00:02:42.525
そしてサンドダンスは実際に
自動はそれを考え出した

00:02:42.525 --> 00:02:45.480
このデータには緯度があり、

00:02:45.480 --> 00:02:47.765
経度、散布図は

00:02:47.765 --> 00:02:51.140
選択する最適なグラフ
この特定のデータをプロットします。

00:02:51.140 --> 00:02:55.610
だから、私たちは推薦者チャートを持っています
サンドダンス内に構築されたタイプ。

00:02:55.610 --> 00:02:57.395
だから今、このデータは良く見えます。

00:02:57.395 --> 00:02:59.300
私は地図を見ることができます
米国の、

00:02:59.300 --> 00:03:01.040
投票データのため、予想通り、

00:03:01.040 --> 00:03:03.590
x軸と
Y 軸も同様です。

00:03:03.590 --> 00:03:07.640
さて、まだ私は存在するかどうか分からない

00:03:07.640 --> 00:03:10.220
の詳細情報
データと私は

00:03:10.220 --> 00:03:13.760
の観点から明らかにフィルタ
x 軸と Y 軸、

00:03:13.760 --> 00:03:16.760
しかし、私がすれば素晴らしいと思いませんか
実際にこれをプロットすることができます

00:03:16.760 --> 00:03:19.085
実際に3次元空間

00:03:19.085 --> 00:03:21.935
どれがどれか見る
最高の分類子。

00:03:21.935 --> 00:03:26.085
それでは、このグラフを作成してみましょう
立体的なもの。

00:03:26.085 --> 00:03:28.620
だから私は「サンドダンス」をクリックし、私は

00:03:28.620 --> 00:03:31.575
[3 次元] をクリックします。
1」、今私はZ軸を持っています。

00:03:31.575 --> 00:03:35.840
今、Z軸で私はすることができます
収入を選択し、参照してください。

00:03:35.840 --> 00:03:38.015
アメリカ全土で何を

00:03:38.015 --> 00:03:40.715
所得人口統計
人々のは、

00:03:40.715 --> 00:03:42.740
あなたはそれを見ることができます
ワシントンは良い成績を上がっています。

00:03:42.740 --> 00:03:44.855
デラウェア州は少し良くなっています。

00:03:44.855 --> 00:03:47.960
そしてニューヨークで
マイアミも素晴らしいです。

00:03:47.960 --> 00:03:49.760
しかし、見てみましょう,

00:03:49.760 --> 00:03:51.725
ホーム値の中央値に換算すると、

00:03:51.725 --> 00:03:53.180
価格はどのように見ていますか?

00:03:53.180 --> 00:03:56.840
グラフが表示されます。
自動的に調整されます。

00:03:56.840 --> 00:04:02.045
また、様々なを持つことができます
使用できるカラー スキーマ。

00:04:02.045 --> 00:04:04.580
だから、私は実際に見ることができました, 収入,

00:04:04.580 --> 00:04:06.230
そして、あなたは私が選ぶことができることがわかります

00:04:06.230 --> 00:04:09.380
異なるカラー スキーマ
実際にグラフに色を付け、グラフに色を付えます。

00:04:09.380 --> 00:04:13.325
私も簡単に
ビンカウントのサイズを変更します。

00:04:13.325 --> 00:04:17.030
だから、あなたはそれを見ることができます
私はビンカウントを変更し、

00:04:17.030 --> 00:04:20.380
グラフを動的に
ただ完全に変化します。

00:04:20.380 --> 00:04:22.130
今、これは良いです。

00:04:22.130 --> 00:04:24.865
データを可視化することもでき、

00:04:24.865 --> 00:04:27.850
ズームイン、ズームアウトが、今、

00:04:27.850 --> 00:04:32.440
私はデータかどうかを確認したい
セットは私に何らかの方法を与えている

00:04:32.440 --> 00:04:34.165
私が予測できる場所

00:04:34.165 --> 00:04:37.445
もしそうなら、いくつかの異常
はデータ内に存在します。

00:04:37.445 --> 00:04:40.880
それでは、まずは次のことを行います。
データの上にいくつかの検索。

00:04:40.880 --> 00:04:46.455
だから私は検索するつもりです
収入が以下の場合、

00:04:46.455 --> 00:04:52.829
40,000ドルと言う
別の式を追加し、

00:04:52.829 --> 00:04:59.675
と言えば、中央値の住宅価格
は $ 800,000 より大きい値です。

00:04:59.675 --> 00:05:02.205
それは良いチェックのようです。

00:05:02.205 --> 00:05:04.230
見つかるかどうか見てみよう
いくつかのデータセット

00:05:04.230 --> 00:05:06.975
実際にこのニーズを満たしています。

00:05:06.975 --> 00:05:10.170
さて、私が実際に行う場合
検索と選択、

00:05:10.170 --> 00:05:12.260
あなたはそれを見ることができます
サンドダンスは、のカップルを持っています

00:05:12.260 --> 00:05:14.660
データ ポイント
実際にそれを拾った。

00:05:14.660 --> 00:05:17.210
これらはグラフに示されています。

00:05:17.210 --> 00:05:20.080
私は簡単に分離することができました
これらのデータ ポイント

00:05:20.080 --> 00:05:21.860
そして今、私はちょうど持っている

00:05:21.860 --> 00:05:24.275
これら4つのサブセット
考慮すべきデータ ポイント。

00:05:24.275 --> 00:05:26.570
人がいるのが分かる

00:05:26.570 --> 00:05:29.825
サンミゲル郡
の家を買った

00:05:29.825 --> 00:05:35.710
$ 812,500 収入 $ 39,070.

00:05:35.710 --> 00:05:39.830
だからサンドダンスは実際に与える
の単位の視覚化

00:05:39.830 --> 00:05:43.985
探索しようとしているデータ
データから意味をなします。

00:05:43.985 --> 00:05:46.220
また、他のことを行うことができます

00:05:46.220 --> 00:05:49.440
あなたが取ることができる場所のように
画像のスナップショット、

00:05:49.440 --> 00:05:51.150
スナップショット ビューを作成する場合は、

00:05:51.150 --> 00:05:53.919
実際にスナップショットを作成できます。

00:05:56.720 --> 00:05:59.690
スナップショット ビューを作成します。

00:05:59.690 --> 00:06:02.630
これで、これを埋め込むことができます
ドキュメント内のスナップショット ビュー

00:06:02.630 --> 00:06:04.160
あなたがしたい
おそらくそれをに送る

00:06:04.160 --> 00:06:05.945
他の誰かを取る
同様に見てください。

00:06:05.945 --> 00:06:08.330
これが私たちが提供している方法です

00:06:08.330 --> 00:06:10.400
のコンテキストでのデータの視覚化

00:06:10.400 --> 00:06:12.635
操作中のデータ。

00:06:12.635 --> 00:06:16.880
さて、また、の一つ
私たちが追加したもの

00:06:16.880 --> 00:06:22.925
サンドダンスの中には能力があった
をクリックしてクエリ結果を視覚化します。

00:06:22.925 --> 00:06:26.060
だからここで私は持っている
私が作成したデータベース、

00:06:26.060 --> 00:06:30.020
そして、この特定のデータベースで
センサーデータテーブルを持っています。

00:06:30.020 --> 00:06:32.840
だから今、私は1,000を選択した場合

00:06:32.840 --> 00:06:35.705
その特定から
テーブルと私はできる

00:06:35.705 --> 00:06:38.135
また、このグラフをクリックします

00:06:38.135 --> 00:06:41.839
ここで、このデータを読み込みます。
ビジュアライザーとしてのサンドダンス、

00:06:41.839 --> 00:06:44.495
これは単なるセンサーですが
データと、それは持っていません

00:06:44.495 --> 00:06:47.210
と同じくらい興味深い
投票データはまだですが、

00:06:47.210 --> 00:06:50.360
これにより、何を簡単に見ることもできます

00:06:50.360 --> 00:06:54.655
のデータビジュアライゼーション
クエリのコンテキストは次のようになります。

00:06:54.655 --> 00:06:57.025
今、この特定のビデオで、

00:06:57.025 --> 00:07:00.035
あなたは私たちがどうなっているかを見てきました
実際にSandDanceを使用して

00:07:00.035 --> 00:07:03.665
データをすばやく視覚化し、

00:07:03.665 --> 00:07:05.705
有意義な傾向と理解

00:07:05.705 --> 00:07:07.190
トレンドが何から起こっているか

00:07:07.190 --> 00:07:09.140
データを使用して役立つ

00:07:09.140 --> 00:07:11.435
高度な機械を構築する
学習アルゴリズム。

00:07:11.435 --> 00:07:13.100
本当にありがとうございました
今日は聞いている。

00:07:13.100 --> 00:07:27.910
[音楽]。

