WEBVTT

00:00:00.000 --> 00:00:03.000
>> SQL Server 2019 Grande
I cluster di dati forniscono

00:00:03.000 --> 00:00:06.585
visualizzare i pool per l'offload
l'elaborazione di query distribuite.

00:00:06.585 --> 00:00:10.350
UC è qui per raccontarci tutto
questo oggi su Data Exposed.

00:00:10.350 --> 00:00:21.060
[MUSICA]

00:00:21.060 --> 00:00:25.215
>> Ciao. Benvenuti a un altro episodio
di Dati Esposti. Sono Jeroen.

00:00:25.215 --> 00:00:27.810
Oggi, sono affiancato da UC
per parlare di calcolo

00:00:27.810 --> 00:00:30.690
pool in SQL ServerPools in SQL Server
cluster di Big Data 2019.

00:00:30.690 --> 00:00:33.000
Ciao, UC. Grazie per
unirsi allo spettacolo di nuovo.

00:00:33.000 --> 00:00:34.155
>> Certo.

00:00:34.155 --> 00:00:36.060
>> Compute pool?

00:00:36.060 --> 00:00:36.615
>> sì.

00:00:36.615 --> 00:00:37.815
>> Che cosa sono?

00:00:37.815 --> 00:00:40.980
>> Compute pools. Sono

00:00:40.980 --> 00:00:44.430
fondamentalmente istanze di SQL Server
in un cluster di Big Data,

00:00:44.430 --> 00:00:48.725
che può essere utilizzato per scaricare il
l'elaborazione di query distribuite.

00:00:48.725 --> 00:00:50.310
Quindi in questa immagine,

00:00:50.310 --> 00:00:54.870
vediamo i molti componenti in
un cluster di Big Data di SQL Server.

00:00:54.870 --> 00:00:58.570
Oggi, stiamo andando a guardare
questo pool di calcolo qui.

00:00:58.570 --> 00:01:01.710
Allora, che cos'è? È
fondamentalmente una serie di

00:01:01.710 --> 00:01:03.825
Istanze di SQL Server che sono

00:01:03.825 --> 00:01:06.685
brochuretto automaticamente
all'interno di un cluster di Big Data,

00:01:06.685 --> 00:01:10.475
e sono disponibili per
query distribuite.

00:01:10.475 --> 00:01:11.405
>> Ok.

00:01:11.405 --> 00:01:14.030
>> Questo è simile al PolyBase

00:01:14.030 --> 00:01:17.585
Gruppi con scalabilità orizzontale in SQL Server 2016.Scale-out Groups in SQL Server 2016.

00:01:17.585 --> 00:01:21.490
Questa funzionalità fornisce ora

00:01:21.490 --> 00:01:25.174
set out-of-the-box di istanze SQL,

00:01:25.174 --> 00:01:27.890
che può fare la maggior parte del
lavoro distribuito per voi.

00:01:27.890 --> 00:01:28.930
>> Ok.

00:01:28.930 --> 00:01:32.540
>> Le query possono utilizzare
il pool di calcolo o non utilizzare

00:01:32.540 --> 00:01:35.540
il pool di calcolo a seconda
sul tipo di query.

00:01:35.540 --> 00:01:38.570
>> Quale scenario vorrei
scegliere per un pool di calcolo?

00:01:38.570 --> 00:01:40.720
>> sì. Grande
Domanda. Quindi vediamo.

00:01:40.720 --> 00:01:44.270
Uno degli scenari comuni è
diciamo che hai due directory in

00:01:44.270 --> 00:01:45.950
HDFS con centinaia e migliaia di

00:01:45.950 --> 00:01:48.355
file e si desidera unirsi a loro.

00:01:48.355 --> 00:01:50.000
Quindi, in questo scenario,

00:01:50.000 --> 00:01:53.390
non si vuole ottenere tutti i
dati su SQL Server.

00:01:53.390 --> 00:01:53.720
>> No.

00:01:53.720 --> 00:01:55.760
>> Che esegue l'applicazione.

00:01:55.760 --> 00:01:57.785
Ecco dove il
pool di calcolo aiuta.

00:01:57.785 --> 00:02:02.270
Così può scaricare la maggior parte
il lavoro verso l'HDFS

00:02:02.270 --> 00:02:03.680
e poi tirare

00:02:03.680 --> 00:02:07.490
i dati necessari al calcolo
piscina e fare l'adesione lì.

00:02:07.490 --> 00:02:09.920
Quindi questo fondamentalmente li scarica tutti,

00:02:09.920 --> 00:02:13.520
il mondo dell'informatica a diversi
Computer SQL Server che possono essere

00:02:13.520 --> 00:02:17.545
su diversi nodi in
quel cluster di Big Data,

00:02:17.545 --> 00:02:19.895
e utilizzare tali risorse.

00:02:19.895 --> 00:02:21.590
Poi gli altri scenari,

00:02:21.590 --> 00:02:23.570
si stanno unendo i dati da

00:02:23.570 --> 00:02:26.780
diverse fonti di dati che
sono partizionati in modo diverso.

00:02:26.780 --> 00:02:31.760
Quindi ci si deve unificare che
partizionamento a un certo punto,

00:02:31.760 --> 00:02:33.530
ed è lì che il
pool di calcolo aiuta.

00:02:33.530 --> 00:02:34.145
>> Ok.

00:02:34.145 --> 00:02:36.710
>> Quindi, se una tabella è distribuita da

00:02:36.710 --> 00:02:40.465
ID cliente e un altro è
distribuiti per ID ordine,

00:02:40.465 --> 00:02:43.400
e sei ancora
l'iscrizione in base all'ID cliente,

00:02:43.400 --> 00:02:46.590
può farlo
riconciliazione per voi.

00:02:46.590 --> 00:02:47.400
>> Ok.

00:02:47.400 --> 00:02:50.070
>> Quindi questo è alcuni degli scenari.

00:02:50.070 --> 00:02:54.259
Puoi anche fare cose come
l'esportazione di dati in HDFS,

00:02:54.259 --> 00:02:56.930
e questo è un altro posto
dove il pool di calcolo può essere utile.

00:02:56.930 --> 00:02:59.090
>> Ok. Quindi il calcolo
piscina mi aiuterà a

00:02:59.090 --> 00:03:01.550
parallelize, scalabilità orizzontale
il mio [non udibile].

00:03:01.550 --> 00:03:02.185
>> sì.

00:03:02.185 --> 00:03:05.430
>> Sia la lettura da HDFS
e scrivere su HDFS?

00:03:05.430 --> 00:03:06.030
>> Sì.

00:03:06.030 --> 00:03:07.350
>> Cool. Come funziona?

00:03:07.350 --> 00:03:09.300
Voglio dire, puoi mostrarci un
po 'di come funziona?

00:03:09.300 --> 00:03:12.605
>> sì. Sicuro. Andiamo qui.

00:03:12.605 --> 00:03:16.885
In realtà sono collegato a un
SQL Server Big Data Cluster,

00:03:16.885 --> 00:03:19.655
e in particolare il Mastered
l'istanza è mostrata qui.

00:03:19.655 --> 00:03:22.280
Così ora abbiamo una nuova DMV,

00:03:22.280 --> 00:03:24.775
che si chiama pool di calcolo.

00:03:24.775 --> 00:03:25.545
>> Ok.

00:03:25.545 --> 00:03:28.610
>> Fondamentalmente, mostra
i pool di calcolo che

00:03:28.610 --> 00:03:31.955
sono sottoposti a provisioning e disponibili
nel Cluster di Big Data.

00:03:31.955 --> 00:03:35.960
Per impostazione predefinita, c'è solo una e
dimostriamo queste informazioni qui.

00:03:35.960 --> 00:03:38.110
Poi si può anche vedere

00:03:38.110 --> 00:03:42.465
quanti nodi sono in realtà
nel pool di calcolo.

00:03:42.465 --> 00:03:44.740
Questa query mostra in realtà,

00:03:44.740 --> 00:03:47.525
a parte questo particolare
istanza di SQL Server,

00:03:47.525 --> 00:03:49.100
Ho due calcoli

00:03:49.100 --> 00:03:52.730
istanze del pool, come mostrato da
queste righe evidenziate, giusto?

00:03:52.730 --> 00:03:53.405
>> sì.

00:03:53.405 --> 00:03:57.815
>> Ci sono altri DMV che
è possibile utilizzare per trovare fondamentalmente

00:03:57.815 --> 00:04:03.195
informazioni sul calcolo
pool come come l'attività della CPU,

00:04:03.195 --> 00:04:05.745
quantità di memoria allocata,

00:04:05.745 --> 00:04:09.900
se è anche disponibile per
la query e così via, giusto?

00:04:09.900 --> 00:04:10.200
>> Destra.

00:04:10.200 --> 00:04:12.470
>> Queste sono informazioni
che un amministratore di database può

00:04:12.470 --> 00:04:15.095
utilizzare per risolvere i problemi del pool di calcolo.

00:04:15.095 --> 00:04:16.145
>> Certo.

00:04:16.145 --> 00:04:20.480
>> Inoltre, è possibile
eseguire una query complessa in

00:04:20.480 --> 00:04:25.955
SQL Server che può effettivamente
andare e utilizzare il pool di calcolo.

00:04:25.955 --> 00:04:26.270
>> Ok.

00:04:26.270 --> 00:04:27.565
>> Quindi, in questo esempio,

00:04:27.565 --> 00:04:32.869
Mi sto unendo a una tabella locale in SQL
server con alcuni dati in HDFS,

00:04:32.869 --> 00:04:37.070
e ho anche un tavolo in
Oracle, su cui sto interrogando.

00:04:37.070 --> 00:04:40.265
Quindi si può fondamentalmente eseguire una query e

00:04:40.265 --> 00:04:42.290
Query Optimizer
cifre automaticamente

00:04:42.290 --> 00:04:44.570
come utilizzare il pool di calcolo.

00:04:44.570 --> 00:04:47.630
In questo caso, sta andando a
utilizzare il pool di computer per

00:04:47.630 --> 00:04:50.930
tavolo HDFS e

00:04:50.930 --> 00:04:54.490
il resto dei dati è
tutti uniti e restituiti.

00:04:54.490 --> 00:04:57.030
Questo è un esempio
in cui un pool di calcolo

00:04:57.030 --> 00:05:00.060
lavora in modo trasparente per
ottenere i risultati per voi.

00:05:00.060 --> 00:05:01.755
>> Cool. Questo è davvero buono.

00:05:01.755 --> 00:05:04.220
Fondamentalmente, posso scrivere questa query.

00:05:04.220 --> 00:05:07.040
Ora posso fidarmi della
pool di calcolo eseguirà il passaggio

00:05:07.040 --> 00:05:10.010
in cui ha senso
ottimizzare le prestazioni, corretto?

00:05:10.010 --> 00:05:10.535
>> Sì.

00:05:10.535 --> 00:05:13.115
>> Fantastico. Beh, grazie
molto per la condivisione.

00:05:13.115 --> 00:05:14.015
>> Certo.

00:05:14.015 --> 00:05:15.500
>> Spero che questo è stato utile.

00:05:15.500 --> 00:05:20.150
Si prega di come o iscriversi
al video e commentare.

00:05:20.150 --> 00:05:22.340
Spero di vederti la prossima volta.
Grazie per l'attenzione.

00:05:22.340 --> 00:05:36.910
[MUSICA]

