WEBVTT

00:00:00.000 --> 00:00:10.530
[MUSIK].

00:00:10.530 --> 00:00:12.300
>> Hallo, ich bin Rony Chatterjee,

00:00:12.300 --> 00:00:15.180
Ich bin Senior Product Manager
im Azure Data-Team.

00:00:15.180 --> 00:00:17.190
Ich arbeite am SQL Server-Produkt und

00:00:17.190 --> 00:00:19.605
heute freue ich mich darauf,
zeigen Ihnen, was wir haben

00:00:19.605 --> 00:00:22.230
als Daten erstellt
Visualisierungserlebnis

00:00:22.230 --> 00:00:25.410
in Azure Data Studio.
Fangen wir an.

00:00:25.410 --> 00:00:27.690
In Azure Data Studio

00:00:27.690 --> 00:00:31.965
Sie haben ein Produkt, das Ihnen

00:00:31.965 --> 00:00:33.960
eine Datenvisualisierung sowie eine

00:00:33.960 --> 00:00:36.600
erfahren zu arbeiten
über Daten überall,

00:00:36.600 --> 00:00:38.970
ob es sich auch um Daten vor Ort handelt

00:00:38.970 --> 00:00:41.755
als Daten in Big Data Clustern.

00:00:41.755 --> 00:00:45.470
In diesem Zusatz von Azure
Data Studio, wie Sie sehen können,

00:00:45.470 --> 00:00:47.870
Ich habe einen SQL-Datenbank-Edge und

00:00:47.870 --> 00:00:51.080
ein SQL Server Big Data
Cluster, mit dem ich verbunden bin.

00:00:51.080 --> 00:00:56.075
Jetzt wird in Azure Data Studio
auf Erweiterungen aufgebaut.

00:00:56.075 --> 00:00:59.300
Eines der Dinge mit
Azure Data Studio bietet

00:00:59.300 --> 00:01:00.830
eine Installationsfähigkeit

00:01:00.830 --> 00:01:03.830
jede Erweiterung, die Sie
wie für Ihren Datenbetrieb.

00:01:03.830 --> 00:01:06.155
Hier also eine der Erweiterungen
die wir gehen, um

00:01:06.155 --> 00:01:08.830
installieren heißt heute SandDance.

00:01:08.830 --> 00:01:12.035
SandDance ist ein Daten-
Visualisierungserfahrung.

00:01:12.035 --> 00:01:15.050
Es bietet Einheit
Visualisierung für die Daten

00:01:15.050 --> 00:01:18.365
Sie möchten erkunden
und visualisieren in SandDance.

00:01:18.365 --> 00:01:21.515
Also hier bearbeite ich
die SandDance-Erweiterung,

00:01:21.515 --> 00:01:22.955
und wie Sie sehen können,

00:01:22.955 --> 00:01:25.535
die SandDance-Erweiterung
wurde gerade installiert.

00:01:25.535 --> 00:01:28.775
Kehren wir also zurück zu
wo sich die Daten befindet.

00:01:28.775 --> 00:01:32.720
So habe ich Daten in der
SQL Server Big Data Cluster.

00:01:32.720 --> 00:01:35.585
Die SQL Server Big Data
Cluster kommt mit

00:01:35.585 --> 00:01:38.330
HDFS mit dem Big Data Cluster

00:01:38.330 --> 00:01:40.745
wo wir speichern können
hohe Datenmenge.

00:01:40.745 --> 00:01:44.510
Eine solche Daten, die ich habe
gespeichert in HDFS für z.B.

00:01:44.510 --> 00:01:48.695
von SQL Server Big Data
Cluster ist ein demovote.tsv.

00:01:48.695 --> 00:01:51.755
Werfen wir also einen Blick auf
wie diese Daten aussehen.

00:01:51.755 --> 00:01:54.230
Wenn Sie also eine schnelle
Vorschau der Daten,

00:01:54.230 --> 00:01:58.040
die Datensätze von HDFS geöffnet werden,

00:01:58.040 --> 00:01:59.150
und wie Sie sehen können,

00:01:59.150 --> 00:02:01.115
das sind nichts anderes als Abstimmungsdaten.

00:02:01.115 --> 00:02:03.230
Sie verfügt über die Abstimmungsdaten
während der Obama,

00:02:03.230 --> 00:02:04.625
Romney Zeitrahmen von

00:02:04.625 --> 00:02:07.160
Wahlen, die stattgefunden haben
in den Vereinigten Staaten.

00:02:07.160 --> 00:02:11.540
Nun, wenn ich dies verarbeiten muss
bestimmten Datensatz und geben Sie ihn an

00:02:11.540 --> 00:02:15.925
meine Datenwissenschaftler, um
aus den Daten sinnvoll sind,

00:02:15.925 --> 00:02:18.010
er müsste tatsächlich
einige Berichte erstellen,

00:02:18.010 --> 00:02:19.265
und ob er

00:02:19.265 --> 00:02:22.330
Datenvisualisierungsbibliothek
strukturell, um es zu sehen,

00:02:22.330 --> 00:02:24.845
oder er verwendet Code

00:02:24.845 --> 00:02:27.695
um tatsächlich zu visualisieren
wie die Daten aussehen.

00:02:27.695 --> 00:02:29.509
Aber in Azure Data Studio

00:02:29.509 --> 00:02:33.170
wir haben unseren Rechtsklick
Ansichtsoption in SandDance.

00:02:33.170 --> 00:02:36.070
Werfen wir einen Blick darauf, wie
Diese Daten sehen aus wie.

00:02:36.070 --> 00:02:39.705
Jetzt können Sie sehen, dass
SandDance lädt auf,

00:02:39.705 --> 00:02:42.525
und SandDance tatsächlich
auto herausgefunden, dass

00:02:42.525 --> 00:02:45.480
diese Daten haben Breitengrad,

00:02:45.480 --> 00:02:47.765
Längengrad und Streudiagramm wäre

00:02:47.765 --> 00:02:51.140
das beste Diagramm zur Auswahl
diese speziellen Daten zu zeichnen.

00:02:51.140 --> 00:02:55.610
So haben wir ein Empfehlungsdiagramm
Typ in SandDance gebaut.

00:02:55.610 --> 00:02:57.395
Nun sehen diese Daten also gut aus.

00:02:57.395 --> 00:02:59.300
Ich kann sehen, dass die Karte
der Vereinigten Staaten,

00:02:59.300 --> 00:03:01.040
wie erwartet, da die Abstimmungsdaten,

00:03:01.040 --> 00:03:03.590
und haben die x-Achse und
auch die y-Achse.

00:03:03.590 --> 00:03:07.640
Jetzt weiß ich noch nicht, ob es

00:03:07.640 --> 00:03:10.220
weitere Informationen in
die Daten und ich könnte

00:03:10.220 --> 00:03:13.760
offensichtlich Filter in Bezug auf
die x-Achse und die y-Achse,

00:03:13.760 --> 00:03:16.760
aber wäre es nicht toll, wenn ich
könnte dies tatsächlich in

00:03:16.760 --> 00:03:19.085
einen dreidimensionalen Raum, um

00:03:19.085 --> 00:03:21.935
welche man sein könnte
der beste Klassifiver.

00:03:21.935 --> 00:03:26.085
Lassen Sie uns also dieses Diagramm erstellen
eine dreidimensionale.

00:03:26.085 --> 00:03:28.620
Wenn ich also auf "SandDance" klicke und wenn ich

00:03:28.620 --> 00:03:31.575
klicken Sie auf die "Dreidimensionale
eins", jetzt habe ich die Z-Achse.

00:03:31.575 --> 00:03:35.840
Jetzt kann ich in der z-Achse
Wählen Sie das Einkommen und sehen Sie

00:03:35.840 --> 00:03:38.015
in den Vereinigten Staaten, was

00:03:38.015 --> 00:03:40.715
die Einkommensdemografie
der Menschen sind.

00:03:40.715 --> 00:03:42.740
Sie können sehen, dass
Washington tut Gutes,

00:03:42.740 --> 00:03:44.855
Delaware geht es ein wenig besser,

00:03:44.855 --> 00:03:47.960
und dann in New York und
Miami ist auch toll.

00:03:47.960 --> 00:03:49.760
Aber werfen wir einen Blick auf,

00:03:49.760 --> 00:03:51.725
in Bezug auf den medianen Eigenheimwert,

00:03:51.725 --> 00:03:53.180
Wie sehen die Preise aus?

00:03:53.180 --> 00:03:56.840
Sie können sehen, dass das Diagramm
automatisch selbst angepasst.

00:03:56.840 --> 00:04:02.045
Sie könnten auch eine verschiedene
Farbschemas, die Sie verwenden können.

00:04:02.045 --> 00:04:04.580
So konnte ich tatsächlich sehen, Einkommen,

00:04:04.580 --> 00:04:06.230
und Sie können sehen, dass ich wählen kann

00:04:06.230 --> 00:04:09.380
verschiedene Farbschemas, um
färben Sie den Graphen tatsächlich.

00:04:09.380 --> 00:04:13.325
Ich könnte auch leicht
ändern Sie die Bincount-Größe.

00:04:13.325 --> 00:04:17.030
So können Sie sehen, dass als
Ich ändere die Bincount,

00:04:17.030 --> 00:04:20.380
Das Diagramm dynamisch
sich einfach komplett ändert.

00:04:20.380 --> 00:04:22.130
Das ist gut.

00:04:22.130 --> 00:04:24.865
Ich kann auch die Daten visualisieren,

00:04:24.865 --> 00:04:27.850
Vergrößern, verkleinern, aber jetzt,

00:04:27.850 --> 00:04:32.440
Ich möchte sehen, ob die Daten
Set gibt mir eine Möglichkeit,

00:04:32.440 --> 00:04:34.165
wo ich vorhersagen konnte

00:04:34.165 --> 00:04:37.445
einige Anomalien, wenn das
innerhalb der Daten vorhanden ist.

00:04:37.445 --> 00:04:40.880
Beginnen wir also damit,
einige Suchen über den Daten.

00:04:40.880 --> 00:04:46.455
Also werde ich suchen
wenn das Einkommen geringer ist,

00:04:46.455 --> 00:04:52.829
sagen Sie 40.000 $, und auch
fügen Sie einen anderen Ausdruck hinzu,

00:04:52.829 --> 00:04:59.675
und sagen wir, medianer Hauswert
ist größer als 800.000 $.

00:04:59.675 --> 00:05:02.205
Das scheint ein guter Check zu sein.

00:05:02.205 --> 00:05:04.230
Mal sehen, ob wir
einige Datensätze, die

00:05:04.230 --> 00:05:06.975
erfüllt diesen Bedarf.

00:05:06.975 --> 00:05:10.170
Nun, wenn ich es tatsächlich tue
eine Suche und Auswahl,

00:05:10.170 --> 00:05:12.260
Sie können sehen, dass
SandDance hat ein paar

00:05:12.260 --> 00:05:14.660
Datenpunkte, die
tatsächlich abgeholt.

00:05:14.660 --> 00:05:17.210
Diese werden in der Grafik dargestellt.

00:05:17.210 --> 00:05:20.080
Ich könnte leicht isolieren
diese Datenpunkte,

00:05:20.080 --> 00:05:21.860
und jetzt habe ich nur

00:05:21.860 --> 00:05:24.275
eine Teilmenge dieser vier
Datenpunkte zu berücksichtigen.

00:05:24.275 --> 00:05:26.570
Sie können sehen, dass es eine Person in

00:05:26.570 --> 00:05:29.825
San Miguel County, der
hat ein Haus von

00:05:29.825 --> 00:05:35.710
812.500 USD mit einem Einkommen von 39.070 USD.

00:05:35.710 --> 00:05:39.830
So SandDance tatsächlich geben
Sie Einheitvisualisierung von

00:05:39.830 --> 00:05:43.985
die Daten, die Sie untersuchen möchten
und aus den Daten sinnvoll sind.

00:05:43.985 --> 00:05:46.220
Sie könnten auch andere Dinge tun

00:05:46.220 --> 00:05:49.440
wie, wo Sie nehmen könnten
eine Momentaufnahme des Bildes,

00:05:49.440 --> 00:05:51.150
Sie eine Snapshot-Ansicht erstellen möchten,

00:05:51.150 --> 00:05:53.919
Sie könnten tatsächlich einen Schnappschuss erstellen,

00:05:56.720 --> 00:05:59.690
und es erstellt eine Snapshot-Ansicht.

00:05:59.690 --> 00:06:02.630
Jetzt können Sie diese einbetten
Snapshotansicht in einem Dokument

00:06:02.630 --> 00:06:04.160
was Sie möchten
wahrscheinlich senden Sie es an

00:06:04.160 --> 00:06:05.945
jemand anderes zu nehmen
auch ein Blick.

00:06:05.945 --> 00:06:08.330
So bieten wir

00:06:08.330 --> 00:06:10.400
Datenvisualisierung im Kontext

00:06:10.400 --> 00:06:12.635
die Daten, in denen Sie arbeiten.

00:06:12.635 --> 00:06:16.880
Nun ist auch einer der
Dinge, die wir hinzugefügt haben

00:06:16.880 --> 00:06:22.925
innerhalb von SandDance war die Fähigkeit,
, um die Abfrageergebnisse zu visualisieren.

00:06:22.925 --> 00:06:26.060
Also hier habe ich eine
Datenbank, die ich erstellt habe,

00:06:26.060 --> 00:06:30.020
und in dieser speziellen Datenbank
Ich habe eine Sensordatentabelle.

00:06:30.020 --> 00:06:32.840
Also jetzt, wenn ich eine 1.000

00:06:32.840 --> 00:06:35.705
von diesem besonderen
Tisch und ich könnte

00:06:35.705 --> 00:06:38.135
klicken Sie auch auf dieses Diagramm

00:06:38.135 --> 00:06:41.839
und laden Sie diese Daten in
der SandDance als Visualizer,

00:06:41.839 --> 00:06:44.495
obwohl dies nur der Sensor ist
Daten und es hat keine

00:06:44.495 --> 00:06:47.210
so interessant wie die
Abstimmungsdaten sind, aber immer noch,

00:06:47.210 --> 00:06:50.360
Dies gibt Ihnen einen schnellen Überblick darüber, was

00:06:50.360 --> 00:06:54.655
die Datenvisualisierung im
Kontext der Abfrage könnte wie sein.

00:06:54.655 --> 00:06:57.025
Nun in diesem speziellen Video,

00:06:57.025 --> 00:07:00.035
sie haben gesehen, wie wir sind
mit SandDance, um

00:07:00.035 --> 00:07:03.665
die Daten schnell zu visualisieren und

00:07:03.665 --> 00:07:05.705
sinnvolle Trends und verstehen

00:07:05.705 --> 00:07:07.190
was die Trends von

00:07:07.190 --> 00:07:09.140
die Daten, so dass es Ihnen helfen kann,

00:07:09.140 --> 00:07:11.435
Aufbau fortschrittlicher Maschinen
Lernalgorithmen.

00:07:11.435 --> 00:07:13.100
Vielen Dank für
Hören in der heutigen.

00:07:13.100 --> 00:07:27.910
[MUSIK].

