WEBVTT

00:00:00.000 --> 00:00:03.000
>> SQL Server 2019 Groß
Datencluster bieten

00:00:03.000 --> 00:00:06.585
Computepools zum Auslagern
verteilte Abfrageverarbeitung.

00:00:06.585 --> 00:00:10.350
UC ist hier, um uns alles über
dies heute auf Data Exposed.

00:00:10.350 --> 00:00:21.060
[MUSIK]

00:00:21.060 --> 00:00:25.215
>> Hallo. Willkommen zu einer anderen Episode
der ausgesetzten Daten. Ich bin Jeroen.

00:00:25.215 --> 00:00:27.810
Heute bin ich von UC
um über Compute zu sprechen

00:00:27.810 --> 00:00:30.690
Pools in SQL Server
2019 Big Data Cluster.

00:00:30.690 --> 00:00:33.000
Hallo, UC. Vielen Dank für
wieder an der Show teilnehmen.

00:00:33.000 --> 00:00:34.155
>> Sicher.

00:00:34.155 --> 00:00:36.060
>> Pools berechnen?

00:00:36.060 --> 00:00:36.615
>> ja.

00:00:36.615 --> 00:00:37.815
>> Was sind das?

00:00:37.815 --> 00:00:40.980
>> Compute Pools. Sie sind

00:00:40.980 --> 00:00:44.430
Im Grunde SQL Server-Instanzen
in einem Big Data-Cluster,

00:00:44.430 --> 00:00:48.725
die verwendet werden können, um Ihre
verteilte Abfrageverarbeitung.

00:00:48.725 --> 00:00:50.310
In diesem Bild,

00:00:50.310 --> 00:00:54.870
sehen wir die vielen Komponenten in
sql Server Big Data Cluster.

00:00:54.870 --> 00:00:58.570
Heute schauen wir uns an,
diesen Computepool hier drüben.

00:00:58.570 --> 00:01:01.710
Was ist das? es ist
im Grunde eine Reihe von

00:01:01.710 --> 00:01:03.825
SQL Server-Instanzen, die

00:01:03.825 --> 00:01:06.685
automatisch prospektiert
in einem Big Data-Cluster,

00:01:06.685 --> 00:01:10.475
und sie sind für
Ausführen einer verteilten Abfragen.

00:01:10.475 --> 00:01:11.405
>> Okay.

00:01:11.405 --> 00:01:14.030
>> Das ist ähnlich wie beim PolyBase

00:01:14.030 --> 00:01:17.585
Horizontale Gruppen in SQL Server 2016.

00:01:17.585 --> 00:01:21.490
Diese Funktion bietet Ihnen jetzt

00:01:21.490 --> 00:01:25.174
Sofort einsatzbereite Gruppe von SQL-Instanzen,

00:01:25.174 --> 00:01:27.890
die die meisten der
verteilte Arbeit für Sie.

00:01:27.890 --> 00:01:28.930
>> Okay.

00:01:28.930 --> 00:01:32.540
>> Abfragen können entweder
den Computepool oder nicht verwenden

00:01:32.540 --> 00:01:35.540
Der Computepool abhängig von
auf den Abfragetyp.

00:01:35.540 --> 00:01:38.570
>> Welches Szenario würde ich
für einen Computepool auswählen?

00:01:38.570 --> 00:01:40.720
>> ja. Großartig
Frage. Mal sehen.

00:01:40.720 --> 00:01:44.270
Eines der häufigsten Szenarien ist
sagen, Sie haben zwei Verzeichnisse in

00:01:44.270 --> 00:01:45.950
HDFS mit Hunderten und Tausenden von

00:01:45.950 --> 00:01:48.355
und Sie möchten sie verbinden.

00:01:48.355 --> 00:01:50.000
In diesem Szenario

00:01:50.000 --> 00:01:53.390
Sie wollen nicht alle
Daten auf Ihren SQL Server übertragen.

00:01:53.390 --> 00:01:53.720
>> Nein.

00:01:53.720 --> 00:01:55.760
>> Womit Ihre Anwendung läuft.

00:01:55.760 --> 00:01:57.785
Das ist also, wo die
Compute-Pool hilft.

00:01:57.785 --> 00:02:02.270
So kann es den größten Teil der
die Arbeit auf das HDFS

00:02:02.270 --> 00:02:03.680
und dann später ziehen

00:02:03.680 --> 00:02:07.490
die notwendigen Daten für die Berechnung
und machen Sie den Join dort.

00:02:07.490 --> 00:02:09.920
Das entlastet sie also im Grunde alle,

00:02:09.920 --> 00:02:13.520
die Computerwelt auf verschiedene
SQL Server-Computer, die

00:02:13.520 --> 00:02:17.545
auf verschiedenen Knoten in
dass Big Data-Cluster,

00:02:17.545 --> 00:02:19.895
und diese Ressourcen zu nutzen.

00:02:19.895 --> 00:02:21.590
Dann die anderen Szenarien,

00:02:21.590 --> 00:02:23.570
Sie daten aus

00:02:23.570 --> 00:02:26.780
unterschiedliche Datenquellen, die
werden unterschiedlich partitioniert.

00:02:26.780 --> 00:02:31.760
Da muss man also vereinenn, dass
Teilung irgendwann,

00:02:31.760 --> 00:02:33.530
und das ist, wo die
Compute-Pool hilft.

00:02:33.530 --> 00:02:34.145
>> Okay.

00:02:34.145 --> 00:02:36.710
>> Wenn also eine Tabelle von

00:02:36.710 --> 00:02:40.465
Kunden-ID und eine andere
verteilt nach Order ID,

00:02:40.465 --> 00:02:43.400
und du bist immer noch
Beitritt durch Kunden-ID,

00:02:43.400 --> 00:02:46.590
es kann, dass
Versöhnung für Sie.

00:02:46.590 --> 00:02:47.400
>> Okay.

00:02:47.400 --> 00:02:50.070
>> Das sind also einige der Szenarien.

00:02:50.070 --> 00:02:54.259
Sie können auch Dinge wie
Exportieren von Daten in HDFS,

00:02:54.259 --> 00:02:56.930
und das ist ein anderer Ort
wo der Computepool helfen kann.

00:02:56.930 --> 00:02:59.090
>> Okay. Die Berechnung
Pool wird mir helfen,

00:02:59.090 --> 00:03:01.550
parallelisieren, horizontal hochskalieren
mein [unhörbar].

00:03:01.550 --> 00:03:02.185
>> ja.

00:03:02.185 --> 00:03:05.430
>> Beide Lesen von HDFS
und überhaupt an HDFS schreiben?

00:03:05.430 --> 00:03:06.030
>> Ja.

00:03:06.030 --> 00:03:07.350
>> Cool. Wie funktioniert das?

00:03:07.350 --> 00:03:09.300
Ich meine, können Sie uns eine
wie das funktioniert?

00:03:09.300 --> 00:03:12.605
>> ja. Sicher. Lassen Sie uns hier gehen.

00:03:12.605 --> 00:03:16.885
Ich bin tatsächlich mit einem
SQL Server Big Data Cluster,

00:03:16.885 --> 00:03:19.655
und speziell die Mastered
Instanz wird hier angezeigt.

00:03:19.655 --> 00:03:22.280
Wir haben also jetzt eine neue DMV,

00:03:22.280 --> 00:03:24.775
Computepools.

00:03:24.775 --> 00:03:25.545
>> Okay.

00:03:25.545 --> 00:03:28.610
>> Grundsätzlich zeigt es
die Computepools, die

00:03:28.610 --> 00:03:31.955
bereitgestellt und verfügbar
im Big Data Cluster.

00:03:31.955 --> 00:03:35.960
Standardmäßig gibt es nur eine und
wir zeigen diese Informationen hier.

00:03:35.960 --> 00:03:38.110
Dann können Sie auch sehen,

00:03:38.110 --> 00:03:42.465
wie viele Knoten tatsächlich sind
dort im Computepool.

00:03:42.465 --> 00:03:44.740
Diese Abfrage zeigt tatsächlich,

00:03:44.740 --> 00:03:47.525
abgesehen von diesem besonderen
SQL Server-Instanz,

00:03:47.525 --> 00:03:49.100
Ich habe zwei Rechendaten

00:03:49.100 --> 00:03:52.730
Poolinstanzen, wie von
diese hervorgehobenen Zeilen, nicht wahr?

00:03:52.730 --> 00:03:53.405
>> ja.

00:03:53.405 --> 00:03:57.815
>> Es gibt weitere DMVs, die
Sie können verwenden, um im Grunde zu finden

00:03:57.815 --> 00:04:03.195
Informationen über die Berechnung
Pool wie wie die CPU-Aktivität,

00:04:03.195 --> 00:04:05.745
wie viel Speicher zugewiesen wurde,

00:04:05.745 --> 00:04:09.900
ob es sogar für
die Abfrage und so weiter, nicht wahr?

00:04:09.900 --> 00:04:10.200
>> Richtig.

00:04:10.200 --> 00:04:12.470
>> Das sind Informationen
die ein DBA

00:04:12.470 --> 00:04:15.095
verwenden, um Computepool zu beheben.

00:04:15.095 --> 00:04:16.145
>> Sicher.

00:04:16.145 --> 00:04:20.480
>> Zusätzlich können Sie
Führen Sie eine komplexe Abfrage in

00:04:20.480 --> 00:04:25.955
SQL Server, der tatsächlich
gehen und den Computepool verwenden.

00:04:25.955 --> 00:04:26.270
>> Okay.

00:04:26.270 --> 00:04:27.565
>> In diesem Beispiel

00:04:27.565 --> 00:04:32.869
Ich schließe mich einer lokalen Tabelle in SQL an
Server mit einigen Daten in HDFS,

00:04:32.869 --> 00:04:37.070
und ich habe auch einen Tisch in
Oracle, das ich abfrage.

00:04:37.070 --> 00:04:40.265
So können Sie grundsätzlich eine Abfrage ausführen und

00:04:40.265 --> 00:04:42.290
der Abfrageoptimierer
automatisch Zahlen

00:04:42.290 --> 00:04:44.570
wie der Computepool verwendet wird.

00:04:44.570 --> 00:04:47.630
In diesem Fall wird es
Verwenden Sie den Computerpool für

00:04:47.630 --> 00:04:50.930
Ihre HDFS-Tabelle und

00:04:50.930 --> 00:04:54.490
der Rest der Daten ist
alle beigetreten und zurückgegeben.

00:04:54.490 --> 00:04:57.030
Das ist ein Beispiel
wobei ein Computepool

00:04:57.030 --> 00:05:00.060
arbeitet transparent daran,
erhalten Sie die Ergebnisse für Sie.

00:05:00.060 --> 00:05:01.755
>> Cool. Das sieht wirklich gut aus.

00:05:01.755 --> 00:05:04.220
Grundsätzlich kann ich diese Abfrage schreiben.

00:05:04.220 --> 00:05:07.040
Ich kann nun der
Computepool führt Schritt

00:05:07.040 --> 00:05:10.010
in dem, wo es sinnvoll ist,
die Leistung optimieren, richtig?

00:05:10.010 --> 00:05:10.535
>> Ja.

00:05:10.535 --> 00:05:13.115
>> Ehrfürchtig. Nun, danke
viel zum Teilen.

00:05:13.115 --> 00:05:14.015
>> Sicher.

00:05:14.015 --> 00:05:15.500
>> Ich hoffe, das war nützlich.

00:05:15.500 --> 00:05:20.150
Bitte mögen oder abonnieren Sie
zum Video und zum Kommentar.

00:05:20.150 --> 00:05:22.340
Hoffe, Sie das nächste Mal zu sehen.
Danke fürs Zuschauen.

00:05:22.340 --> 00:05:36.910
[MUSIK]

