WEBVTT

00:00:09.680 --> 00:00:10.780
>> [Musik].

00:00:10.780 --> 00:00:12.750
>> Hallo. Ich bin Vicki Harfe mit
SQL Server-Produktteam.

00:00:12.750 --> 00:00:15.870
Ich bin heute hier, um Ihnen zu zeigen
Notebooks und Azure Data Studio.

00:00:15.870 --> 00:00:18.825
Notebooks sind also ein Konzept in

00:00:18.825 --> 00:00:20.660
Data Science, die

00:00:20.660 --> 00:00:22.940
verwendet, um eine Menge von
Datenvisualisierung,

00:00:22.940 --> 00:00:25.010
Datenexploration und Datenarbeit,

00:00:25.010 --> 00:00:26.855
hauptsächlich in der Python-Sprache.

00:00:26.855 --> 00:00:28.760
Wenn Die Leute reden
über Notebooks,

00:00:28.760 --> 00:00:30.485
viele Male reden wir
über Jupiter Notebooks.

00:00:30.485 --> 00:00:32.660
Die Implementierung von Notebooks

00:00:32.660 --> 00:00:34.730
die wir in Azure Data Studio haben,

00:00:34.730 --> 00:00:37.070
ein Jupiter-Notebook mit einem
benutzerdefiniertes Front-End, das

00:00:37.070 --> 00:00:40.430
besser auf die
Azure Data Studio-Erfahrung.

00:00:40.430 --> 00:00:45.450
Also zuerst werde ich zeigen,
Sie ein einfaches Python-Notebook.

00:00:45.450 --> 00:00:46.760
Dies ist ein Notizbuch, das

00:00:46.760 --> 00:00:49.250
Python-Sprache und
Sie können sehen, dass wir

00:00:49.250 --> 00:00:51.620
einen Abschnitt hier oben, der

00:00:51.620 --> 00:00:54.395
einen menschenlesbaren Text und eine
Abschnitt unten, der Code hat.

00:00:54.395 --> 00:00:56.149
Also, wenn ich auf run auf diesem,

00:00:56.149 --> 00:00:58.010
Dieser spezielle Code ruft

00:00:58.010 --> 00:01:00.755
Internet und zieht eine
zufälliges Foto eines Hundes.

00:01:00.755 --> 00:01:03.710
Um Ihnen rund um die
Notebook-Erfahrung,

00:01:03.710 --> 00:01:05.390
wir haben hier einen Picker,

00:01:05.390 --> 00:01:06.770
wir können die Sprache wählen.

00:01:06.770 --> 00:01:08.630
In diesem Fall bin ich also
Ausführen von Python 3,

00:01:08.630 --> 00:01:10.475
und ich führe es
auf meinem lokalen Computer.

00:01:10.475 --> 00:01:13.460
Ich könnte stattdessen zu
die Sprache SQL und dann

00:01:13.460 --> 00:01:16.430
Wählen Sie den MySQL-Server aus
Maschinen, an die ich anhängen möchte.

00:01:16.430 --> 00:01:18.605
Ich habe MySQL-Server hier aufgelistet.

00:01:18.605 --> 00:01:21.830
Um es ein wenig weiter zu bringen,

00:01:21.830 --> 00:01:24.230
Ich zeige Ihnen ein Beispiel
wie Sie dies verwenden könnten.

00:01:24.230 --> 00:01:28.025
Hier habe ich also einen SQL Server
2019 Big Data Cluster, der

00:01:28.025 --> 00:01:32.555
SQL Server läuft in Kubernetes
mit SQL und Spark.

00:01:32.555 --> 00:01:34.490
Also hier in meinem HDFS-Bereich,

00:01:34.490 --> 00:01:38.040
Ich habe dieses Verzeichnis erhalten
cSV-Dateien.

00:01:38.040 --> 00:01:40.890
Wenn ich mir das anschaue,

00:01:40.890 --> 00:01:42.260
Sie können sehen, dass es eine Menge von

00:01:42.260 --> 00:01:44.780
Informationen über Hund
Lizenzinformationen.

00:01:44.780 --> 00:01:46.970
Dies ist also eigentlich der Data Dump von

00:01:46.970 --> 00:01:48.320
Allegheny County in Pennsylvania

00:01:48.320 --> 00:01:51.230
Hundelizenzen für die
mehrere Jahre dauern.

00:01:51.230 --> 00:01:55.775
Also mit dem Spark
Sprache und verbinden

00:01:55.775 --> 00:02:00.440
zu Python mit Spark auf der
SQL Server Big Data Cluster.

00:02:00.440 --> 00:02:02.045
Ich kann laufen,

00:02:02.045 --> 00:02:05.780
Code zum Lesen dieser Dateien
direkt aus CSV.

00:02:05.780 --> 00:02:07.760
Dann kann ich eine Analyse durchführen.

00:02:07.760 --> 00:02:09.890
In diesem Fall werde ich also
die Anzahl der Zeilen abrufen.

00:02:09.890 --> 00:02:15.645
Ich werde die unterschiedlichen
Liste nur der Namen,

00:02:15.645 --> 00:02:17.215
so haben wir 25.000 Namen.

00:02:17.215 --> 00:02:20.825
Dann ziehe ich
zufälligen Namen aus diesem Hut.

00:02:20.825 --> 00:02:22.550
Wir haben hier also einen Namen.

00:02:22.550 --> 00:02:25.850
Nun, wenn ich einen Funken benutzte,

00:02:25.850 --> 00:02:29.120
wenn ich sehr daran gewöhnt war,
Python, das wäre toll.

00:02:29.120 --> 00:02:30.770
Aber wenn ich eher eine SQL-Person bin,

00:02:30.770 --> 00:02:33.320
dann möchte ich vielleicht eine Verbindung herstellen
auf denselben Datensatz,

00:02:33.320 --> 00:02:36.040
Ich werde Cluster ausführen
mit der SQL-Sprache.

00:02:36.040 --> 00:02:41.420
Hier habe ich externe
Tabelle über diesem Dateiformat.

00:02:41.420 --> 00:02:43.870
Das ist etwas, was Sie
kann dies mit einem Assistenten tun.

00:02:43.870 --> 00:02:45.250
Ich werde hierher gehen,

00:02:45.250 --> 00:02:46.930
externe Tabelle aus CSV-Dateien erstellen.

00:02:46.930 --> 00:02:50.315
Dann würde das diese
externe Tabelle, die ich verwende.

00:02:50.315 --> 00:02:52.415
Aber in diesem Fall habe ich
mit Code.

00:02:52.415 --> 00:02:56.500
Wenn ich Laufzellen treffe,

00:02:56.500 --> 00:02:59.765
Sie können sehen, dass ich auch SQL verwende

00:02:59.765 --> 00:03:03.625
auf dieselben Daten zuzugreifen, die
Ich habe gerade mit Spark zugegriffen.

00:03:03.625 --> 00:03:07.410
Nun werden diese Dateien
als IPYNB-Dateien gespeichert,

00:03:07.410 --> 00:03:10.970
die ich dann mit meinem
Kollegen und ich können wieder laufen.

00:03:10.970 --> 00:03:14.465
Für den Fall, dass ich
wollte dies heute laufen,

00:03:14.465 --> 00:03:15.995
senden Sie es an meinen Kollegen,

00:03:15.995 --> 00:03:18.950
sie könnten öffnen
auf ihre sofortige und

00:03:18.950 --> 00:03:20.480
an ihren eigenen Cluster anfügen oder

00:03:20.480 --> 00:03:22.535
auf denselben Cluster und führen Sie ihn erneut aus.

00:03:22.535 --> 00:03:24.800
Wir verwenden auch Notebooks
auf ein paar andere Arten.

00:03:24.800 --> 00:03:27.485
Hier haben wir etwas
Jupiter-Bücher genannt.

00:03:27.485 --> 00:03:30.710
Dies ist eine Liste von Notebooks im Wesentlichen

00:03:30.710 --> 00:03:34.130
die zusammen zusammengestellt worden waren
in ein Kapitelseitenformat.

00:03:34.130 --> 00:03:37.775
Hier haben wir also eine SQL
Server ML-Dienstkurs,

00:03:37.775 --> 00:03:40.985
die über Notebooks angezeigt wird.

00:03:40.985 --> 00:03:43.070
So haben wir alle
Dokumentation vorhanden.

00:03:43.070 --> 00:03:46.445
Wir haben die Codebeispiele
hier und dann können Sie,

00:03:46.445 --> 00:03:47.780
am Ende jedes Kapitels,

00:03:47.780 --> 00:03:49.730
entweder den nächsten treffern
, um zum nächsten zu gehen

00:03:49.730 --> 00:03:52.400
oder verwenden Sie dieses Kapitel
Browser, um es auszuwählen.

00:03:52.400 --> 00:03:54.965
Wir haben auch die
Unterstützungsbuch

00:03:54.965 --> 00:03:57.255
für SQL Server 2019
Big Data-Cluster.

00:03:57.255 --> 00:03:59.210
Wenn ich die
Befehlspilot und Kommissionierung

00:03:59.210 --> 00:04:01.160
dieser Jupiter Bücher 2019 Führer,

00:04:01.160 --> 00:04:03.035
das ist, was ich benutze, um dies zu öffnen.

00:04:03.035 --> 00:04:05.960
Hier haben wir alle
Informationen, die Sie möglicherweise

00:04:05.960 --> 00:04:08.885
notwendigkeit, um die
Ihren neuen Big Data Cluster,

00:04:08.885 --> 00:04:11.585
viele der Kubernetes-Befehle,
die Clusterinformationen.

00:04:11.585 --> 00:04:13.565
Das ist etwas, das Sie ausführen können,

00:04:13.565 --> 00:04:14.735
Sie können an jemand anderen senden,

00:04:14.735 --> 00:04:17.065
und Sie können speichern und
tun, was Sie wollen.

00:04:17.065 --> 00:04:21.140
Wir freuen uns also sehr über
Notizbücher in Azure Data Studio.

00:04:21.140 --> 00:04:23.210
Wir glauben wirklich, dass diese
ist etwas, das

00:04:23.210 --> 00:04:26.210
sehr nützlich für unsere Gemeinschaft.

00:04:26.210 --> 00:04:28.040
Wir sind wirklich interessiert
bei der Suche nach, wie

00:04:28.040 --> 00:04:29.765
Sie es verwenden und
was Sie von uns wollen.

00:04:29.765 --> 00:04:32.800
Wenn Sie also an
mehr lernen, gehen Sie zu GitHub,

00:04:32.800 --> 00:04:34.610
suchen Sie nach Azure Data Studio und

00:04:34.610 --> 00:04:37.120
kann Funktion öffnen
inter bugs anfordern.

00:04:37.120 --> 00:04:39.470
Das ist auch, wo Sie
kann sowohl die

00:04:39.470 --> 00:04:51.991
stabil und die Insider Hinzufügen.
Vielen Dank für Ihre Zeit.

00:04:51.991 --> 00:04:57.040
>> [MUSIK]

