WEBVTT

00:00:00.000 --> 00:00:03.070
>> SQL Server 2019 groß
Datencluster bieten

00:00:03.070 --> 00:00:04.950
Datenpools zur Optimierung

00:00:04.950 --> 00:00:07.905
Abfrageleistung beim Erreichen
an mehrere Quellen.

00:00:07.905 --> 00:00:10.080
Umachandar ist hier mit
uns heute, um uns alle zu sagen

00:00:10.080 --> 00:00:12.450
darüber heute auf Data Exposed.

00:00:12.450 --> 00:00:23.550
[MUSIK].

00:00:23.550 --> 00:00:26.250
>> Hallo und willkommen zu einem anderen
Episode von Data Exposed.

00:00:26.250 --> 00:00:29.100
Ich bin dein Gastgeber Jeroen und
heute haben wir Sie sehen uns

00:00:29.100 --> 00:00:32.085
So sprechen Sie über Datenpools
in SQL Big Data-Clustern.

00:00:32.085 --> 00:00:33.675
Hallo Umachandar willkommen zur Show.

00:00:33.675 --> 00:00:35.460
>> Hallo, ich bin glücklich, hier zu sein.

00:00:35.460 --> 00:00:38.160
>> So Data Pools in
Big-Data-Cluster.

00:00:38.160 --> 00:00:40.505
Was ist es? Was muss ich wissen?

00:00:40.505 --> 00:00:42.440
>> Sicher ja, lassen Sie mich schnell anfangen

00:00:42.440 --> 00:00:45.110
indem sie zeigt, was ein
Big Data Cluster ist.

00:00:45.110 --> 00:00:48.090
Diese Folie zeigt die Bereitstellung von

00:00:48.090 --> 00:00:52.110
SQL Server 19 Big Data
Cluster und heute sind wir

00:00:52.110 --> 00:00:56.360
über die Daten sprechen
Pools hier, die im Grunde

00:00:56.360 --> 00:00:59.300
zwei SQL-Server-Instanzen, die

00:00:59.300 --> 00:01:02.960
verwendet, um einige
Abfrage [unhörbar].

00:01:02.960 --> 00:01:04.810
Sehen wir uns also an, was ein Datenpool ist.

00:01:04.810 --> 00:01:08.390
Es ist also im Grunde SQL-Server
Speicher und Rechenleistung, die

00:01:08.390 --> 00:01:13.550
bereitgestellt, um die Abfragen zu schreiben
und speichern Sie Daten im Datenpool.

00:01:13.550 --> 00:01:16.310
Es kann manipuliert werden, indem

00:01:16.310 --> 00:01:20.900
Einige externe Tabellenoperationen
und Sie füllen Daten

00:01:20.900 --> 00:01:24.440
in den Datenpool und
später können Sie tatsächlich

00:01:24.440 --> 00:01:28.970
einige Ihrer analytischen
Abfragen an diesen Datenpool.

00:01:28.970 --> 00:01:32.400
Das ist also die primäre
Zweck des Datenpools.

00:01:32.400 --> 00:01:37.140
So können wir jetzt schnell nehmen
ein Blick auf einige der Szenarien.

00:01:37.140 --> 00:01:39.980
Das häufige Szenario ist also, dass Sie

00:01:39.980 --> 00:01:42.710
Abrufen von Daten von
verschiedene Datenquellen,

00:01:42.710 --> 00:01:44.570
einige von ihnen sind schnell,

00:01:44.570 --> 00:01:47.345
andere sind langsamer in der Natur.

00:01:47.345 --> 00:01:51.050
Jetzt wollen Sie also grundsätzlich optimieren

00:01:51.050 --> 00:01:55.535
Diese Abfrage, damit Sie
Tatsächlich diese Abfrage annehmen

00:01:55.535 --> 00:02:00.350
und speichern Sie die Ergebnisse in der
Data Pool und dies ermöglicht es Ihnen,

00:02:00.350 --> 00:02:02.900
im Grunde verwenden, dass wie

00:02:02.900 --> 00:02:07.300
ein Staging-Bereich, in dem Sie
können alle Ihre Analysen ausführen.

00:02:07.300 --> 00:02:10.830
Das andere Beispiel ist, wenn Sie
Maschinelles Lernen,

00:02:10.830 --> 00:02:12.830
es gibt eine Menge von
Szenarien, in denen Sie

00:02:12.830 --> 00:02:14.960
würde Features generieren
und Hunderte und

00:02:14.960 --> 00:02:18.290
Tausende von Funktionen und
Sie möchten im Grunde speichern

00:02:18.290 --> 00:02:23.040
den Datensatz an einem Ort, an dem
Sie können wiederholte Analysen durchführen.

00:02:23.040 --> 00:02:26.145
Das ist ein weiterer Ort, an dem
der Datenpool hilft.

00:02:26.145 --> 00:02:29.540
>> In diesem Fall ist es also nicht
nur für die Abfrageoptimierung

00:02:29.540 --> 00:02:31.190
sondern auch, um sicherzustellen, dass
sie müssen nicht gehen

00:02:31.190 --> 00:02:32.975
zurück zur Datenquelle
die ganze Zeit, nicht wahr?

00:02:32.975 --> 00:02:33.230
>> Ja.

00:02:33.230 --> 00:02:34.385
>> Wenn Sie die Daten wiederverwenden möchten.

00:02:34.385 --> 00:02:34.625
>> ja.

00:02:34.625 --> 00:02:35.660
>> Cool, das klingt sehr cool.

00:02:35.660 --> 00:02:37.355
So können Sie tatsächlich
zeigen Sie uns, wie das funktioniert?

00:02:37.355 --> 00:02:40.550
>> ja, los geht es
zu beurteilen, wie viel hier ist.

00:02:40.550 --> 00:02:42.230
Was ich hier habe, ist

00:02:42.230 --> 00:02:45.530
eine Verbindung mit sql
Server Big Data Cluster.

00:02:45.530 --> 00:02:48.890
Ich bin mit dem SQL verbunden
Servermasterinstanz.

00:02:48.890 --> 00:02:51.905
So können Sie einen Datenpool erstellen

00:02:51.905 --> 00:02:55.625
ist zuerst durch das Erstellen
dieses Datenquellenobjekt.

00:02:55.625 --> 00:02:58.100
Also hier, wie dieser Name angibt

00:02:58.100 --> 00:03:01.325
hier sagt dies im Grunde, was
Typ einer Datenquelle.

00:03:01.325 --> 00:03:04.400
Dann werde ich
verbindung zu einem Datenpool herstellen.

00:03:04.400 --> 00:03:05.530
>> Okay.

00:03:05.530 --> 00:03:08.780
>> So sind Sie
erstellen. Danach

00:03:08.780 --> 00:03:11.360
Sie definieren die Tabelle
was Sie möchten

00:03:11.360 --> 00:03:13.940
speichern in den Daten
Pool und das ist geschafft

00:03:13.940 --> 00:03:16.670
durch Ausführen dieser externen
Tabellenanweisung.

00:03:16.670 --> 00:03:17.845
>> Okay.

00:03:17.845 --> 00:03:21.090
>> Das sieht aus wie Ihr
Tabellenanweisung erstellen,

00:03:21.090 --> 00:03:24.110
Es gibt Spalten, die
Sie definieren und in

00:03:24.110 --> 00:03:27.725
Hinzufügen, da es viele SQL-
Serverinstanzen auf dem Backend.

00:03:27.725 --> 00:03:28.115
>> Richtig.

00:03:28.115 --> 00:03:30.740
>> Sie müssen nur sagen, wie Sie
die Daten verteilen möchten.

00:03:30.740 --> 00:03:32.630
>> Damit merkt man sich, okay,

00:03:32.630 --> 00:03:36.155
so bekamen wir eine gerade oder ungefähre
gleichmäßige Verteilung über.

00:03:36.155 --> 00:03:36.515
>> ja.

00:03:36.515 --> 00:03:37.400
>> Über den Service.

00:03:37.400 --> 00:03:37.685
>> Ja.

00:03:37.685 --> 00:03:38.000
>> Okay.

00:03:38.000 --> 00:03:41.330
>> Das ist es, was der Round Robin
tut im Grunde verteilt

00:03:41.330 --> 00:03:44.825
Daten darüber, wie viele
Data Pool-Instanzen, die Sie haben.

00:03:44.825 --> 00:03:45.865
>> Okay.

00:03:45.865 --> 00:03:49.370
>> Das nächste, was Sie können
tun ist wie die Abfrage der Daten.

00:03:49.370 --> 00:03:50.780
Schauen wir uns also zunächst einige der

00:03:50.780 --> 00:03:54.155
die Beispieldaten, die in
Dieses Beispiel habe ich in

00:03:54.155 --> 00:03:57.680
HDFS-Verzeichnis und im Grunde

00:03:57.680 --> 00:04:00.155
Ich möchte diese
Clickstream-Daten,

00:04:00.155 --> 00:04:04.490
Einige Abfragen ausstellen und auffüllen
in den Datenpool.

00:04:04.490 --> 00:04:08.915
Die Art und Weise, wie Sie es tun würden, ist durch
nur eine Insert-Anweisung ausführen.

00:04:08.915 --> 00:04:13.490
Die Quelle des Einsatzes
Anweisung ist nur eine SQL-Abfrage,

00:04:13.490 --> 00:04:18.140
und Sie können einfach die
abfragen und füllen Sie die Daten.

00:04:18.140 --> 00:04:21.320
Ich werde nicht durch die
Einsätze, aber lassen Sie uns schnell

00:04:21.320 --> 00:04:25.205
siehe die Daten, die bereits
im Datenpool ausgefüllt.

00:04:25.205 --> 00:04:28.445
Daher sollte diese Abfrage
ca. 2.000 Zeilen, oder?

00:04:28.445 --> 00:04:32.930
Jetzt wie jeder andere
Tabelle, der Sie tatsächlich beitreten können

00:04:32.930 --> 00:04:37.460
Diese Tabelle mit anderen Tabellen
in Ihrem SQL Server und

00:04:37.460 --> 00:04:39.680
die Ergebnisse und transparent

00:04:39.680 --> 00:04:42.200
Diese SQL Server-Instanz
wird mit

00:04:42.200 --> 00:04:47.555
die auszuführenden Data Pool-Instanzen
und erhalten Sie die Ergebnisse.

00:04:47.555 --> 00:04:50.330
Das ist also auf hohem Niveau
von dem, was ein Datenpool ist.

00:04:50.330 --> 00:04:51.530
>> Cool genial.

00:04:51.530 --> 00:04:54.390
Das ist sehr beeindruckend.
Vielen Dank Mann.

00:04:54.390 --> 00:04:55.530
>> Cool ja, danke.

00:04:55.530 --> 00:04:58.050
>> Okay. Also vielen Dank für das Zuschauen.

00:04:58.050 --> 00:04:59.590
Bitte mögen und abonnieren Sie,

00:04:59.590 --> 00:05:02.150
Kommentar zum Video
wenn Sie wollen, dass wir

00:05:02.150 --> 00:05:06.360
etwas anderes aufzeichnen und hoffen
, um Sie das nächste Mal zu sehen. Danke.

00:05:06.360 --> 00:05:20.860
[MUSIK]

