WEBVTT

00:00:00.000 --> 00:00:03.070
>> SQL Server 2019 grande
cluster di dati forniscono

00:00:03.070 --> 00:00:04.950
Pool di dati per ottimizzare

00:00:04.950 --> 00:00:07.905
prestazioni delle query quando si raggiunge
su più fonti.

00:00:07.905 --> 00:00:10.080
Umachandar è qui con
noi oggi per dirci tutti

00:00:10.080 --> 00:00:12.450
su di esso oggi su Data Exposed.

00:00:12.450 --> 00:00:23.550
[MUSICA].

00:00:23.550 --> 00:00:26.250
>> Ciao e benvenuto a un altro
episodio di Data Exposed.

00:00:26.250 --> 00:00:29.100
Sono il tuo ospite Jeroen e
oggi abbiamo avete si vede il noi

00:00:29.100 --> 00:00:32.085
per parlare di pool di dati
nei cluster di Big Data SQL.

00:00:32.085 --> 00:00:33.675
Ciao Umachandar benvenuto allo spettacolo.

00:00:33.675 --> 00:00:35.460
>> Ciao, sono felice di essere qui.

00:00:35.460 --> 00:00:38.160
>> Così pool di dati in
cluster di Big Data.

00:00:38.160 --> 00:00:40.505
Cos'è? Cosa devo sapere?

00:00:40.505 --> 00:00:42.440
>> Certo sì, mi permetta di iniziare rapidamente

00:00:42.440 --> 00:00:45.110
mostrando ciò che un
Big Data Cluster è.

00:00:45.110 --> 00:00:48.090
Quindi questa diapositiva mostra la distribuzione di

00:00:48.090 --> 00:00:52.110
SQL Server 19 Big Data
Cluster e oggi siamo

00:00:52.110 --> 00:00:56.360
andando a parlare dei dati
Piscine qui che sono fondamentalmente

00:00:56.360 --> 00:00:59.300
due istanze di SQL Server che possono essere

00:00:59.300 --> 00:01:02.960
utilizzato per scaricare alcuni
query [non udibile].

00:01:02.960 --> 00:01:04.810
Quindi vediamo che cosa è un pool di dati.

00:01:04.810 --> 00:01:08.390
Quindi è fondamentalmente SQL server
l'archiviazione e il calcolo, che è

00:01:08.390 --> 00:01:13.550
fornito per scrivere le query
e memorizzare i dati nel pool di dati.

00:01:13.550 --> 00:01:16.310
Può essere manipolato eseguendo

00:01:16.310 --> 00:01:20.900
alcune operazioni di tabella esterna
su di esso e si popolano i dati

00:01:20.900 --> 00:01:24.440
nel pool di dati e
più tardi si può effettivamente

00:01:24.440 --> 00:01:28.970
scaricare alcuni dei vostri analitici
query a questo pool di dati.

00:01:28.970 --> 00:01:32.400
Quindi questo è il primario
scopo del Pool di dati.

00:01:32.400 --> 00:01:37.140
Quindi ora cerchiamo di essere rapidamente prendere
uno sguardo ad alcuni degli scenari.

00:01:37.140 --> 00:01:39.980
Quindi lo scenario comune è che sei

00:01:39.980 --> 00:01:42.710
ottenere dati da
diverse fonti di dati,

00:01:42.710 --> 00:01:44.570
alcuni di loro sono veloci,

00:01:44.570 --> 00:01:47.345
altri sono più lenti in natura.

00:01:47.345 --> 00:01:51.050
Così ora si vuole fondamentalmente ottimizzare

00:01:51.050 --> 00:01:55.535
questa query in modo da poter
effettivamente prendere quella query

00:01:55.535 --> 00:02:00.350
e memorizzare i risultati nel
Pool di dati e questo consente di

00:02:00.350 --> 00:02:02.900
fondamentalmente utilizzare che come

00:02:02.900 --> 00:02:07.300
un'area di sosta in cui
può eseguire tutte le analisi.

00:02:07.300 --> 00:02:10.830
L'altro esempio è che se sei
facendo l'apprendimento automatico,

00:02:10.830 --> 00:02:12.830
ci sono un sacco di
scenari in cui si

00:02:12.830 --> 00:02:14.960
genererebbe funzionalità
e centinaia e

00:02:14.960 --> 00:02:18.290
migliaia di funzioni e
si desidera memorizzare fondamentalmente

00:02:18.290 --> 00:02:23.040
il set di dati in un luogo in cui
è possibile eseguire analisi ripetute.

00:02:23.040 --> 00:02:26.145
Questo è un altro posto dove
il Pool di dati aiuta.

00:02:26.145 --> 00:02:29.540
>> Quindi, in questo caso non è
solo per l'ottimizzazione delle query

00:02:29.540 --> 00:02:31.190
ma anche per fare in modo
non c'è bisogno di andare

00:02:31.190 --> 00:02:32.975
torna all'origine dati
tutto il tempo, giusto?

00:02:32.975 --> 00:02:33.230
>> Sì.

00:02:33.230 --> 00:02:34.385
>> Se si desidera riutilizzare i dati.

00:02:34.385 --> 00:02:34.625
>> sì.

00:02:34.625 --> 00:02:35.660
>> Cool, che suona molto cool.

00:02:35.660 --> 00:02:37.355
Così si può effettivamente
mostrarci come funziona?

00:02:37.355 --> 00:02:40.550
>> Sì, andiamo rapidamente
per valutare quanto è qui.

00:02:40.550 --> 00:02:42.230
Quindi quello che ho qui è

00:02:42.230 --> 00:02:45.530
una connessione al codice SQL
Cluster di Big Data del server.

00:02:45.530 --> 00:02:48.890
Sono connesso a SQL
Istanza master del server.

00:02:48.890 --> 00:02:51.905
Quindi il modo per creare un pool di dati

00:02:51.905 --> 00:02:55.625
è il primo creando
questo oggetto origine dati.

00:02:55.625 --> 00:02:58.100
Quindi qui come questo nome indica

00:02:58.100 --> 00:03:01.325
qui questo dice fondamentalmente quello che
tipo di un'origine dati di cui si trova.

00:03:01.325 --> 00:03:04.400
Poi questo ho intenzione di
connettersi a un pool di dati.

00:03:04.400 --> 00:03:05.530
>> Ok.

00:03:05.530 --> 00:03:08.780
>> Ecco come si
crearlo. Dopo di che

00:03:08.780 --> 00:03:11.360
si definisce la tabella
che si desidera

00:03:11.360 --> 00:03:13.940
memorizzare nei dati
Piscina e questo è fatto

00:03:13.940 --> 00:03:16.670
eseguendo questo esterno
l'istruzione table.

00:03:16.670 --> 00:03:17.845
>> Ok.

00:03:17.845 --> 00:03:21.090
>> Questo sembra che il vostro regolare
creare un'istruzione di tabella,

00:03:21.090 --> 00:03:24.110
ci sono colonne che
è necessario definire e in

00:03:24.110 --> 00:03:27.725
aggiunta dal momento che ci sono molti SQL
le istanze del server sul back-end.

00:03:27.725 --> 00:03:28.115
>> Destra.

00:03:28.115 --> 00:03:30.740
>> Hai solo bisogno di dire come si
desidera distribuire i dati.

00:03:30.740 --> 00:03:32.630
>> Quindi con questo si può dire, va bene,

00:03:32.630 --> 00:03:36.155
così abbiamo ottenuto un pari o approssimativamente
distribuzione uniforme in tutto.

00:03:36.155 --> 00:03:36.515
>> sì.

00:03:36.515 --> 00:03:37.400
>> In tutto il servizio.

00:03:37.400 --> 00:03:37.685
>> Sì.

00:03:37.685 --> 00:03:38.000
>> Ok.

00:03:38.000 --> 00:03:41.330
>> Quindi questo è ciò che il round robin
fa è fondamentalmente distribuire

00:03:41.330 --> 00:03:44.825
i dati attraverso quanti di
Istanze del pool di dati disponibili.

00:03:44.825 --> 00:03:45.865
>> Ok.

00:03:45.865 --> 00:03:49.370
>> La prossima cosa che puoi
fare è come interrogare i dati.

00:03:49.370 --> 00:03:50.780
Quindi diamo prima un'occhiata ad alcuni dei

00:03:50.780 --> 00:03:54.155
i dati di esempio che in
questo esempio che ho in

00:03:54.155 --> 00:03:57.680
directory HDFS e fondamentalmente

00:03:57.680 --> 00:04:00.155
Voglio prendere questi
dati clickstream,

00:04:00.155 --> 00:04:04.490
fare qualche query e popolare
nel pool di dati.

00:04:04.490 --> 00:04:08.915
Il modo in cui lo faresti è
in esecuzione solo un'istruzione insert.

00:04:08.915 --> 00:04:13.490
Quindi la fonte dell'inserto
istruzione è solo una query SQL,

00:04:13.490 --> 00:04:18.140
e si può semplicemente eseguire il
query e popolare i dati.

00:04:18.140 --> 00:04:21.320
Non voglio correre attraverso il
inserti, ma cerchiamo di rapidamente

00:04:21.320 --> 00:04:25.205
vedere i dati che sono già
inserito nel pool di dati.

00:04:25.205 --> 00:04:28.445
Quindi questa query dovrebbe restituire
circa 2.000 righe, giusto?

00:04:28.445 --> 00:04:32.930
Così ora, proprio come qualsiasi altro
tabella si può effettivamente unire

00:04:32.930 --> 00:04:37.460
questa tabella con altre tabelle
in SQL Server e ottenere

00:04:37.460 --> 00:04:39.680
i risultati e in modo trasparente

00:04:39.680 --> 00:04:42.200
questa istanza di SQL Server
sta per parlare con

00:04:42.200 --> 00:04:47.555
le istanze del pool di dati da eseguire
le query e ottenere i risultati.

00:04:47.555 --> 00:04:50.330
Quindi questo è ad un livello elevato
di cosa sia un pool di dati.

00:04:50.330 --> 00:04:51.530
>> Cool impressionante.

00:04:51.530 --> 00:04:54.390
È davvero impressionante.
Grazie mille, amico.

00:04:54.390 --> 00:04:55.530
>> Cool sì, grazie.

00:04:55.530 --> 00:04:58.050
>> Ok. Quindi grazie per la visione.

00:04:58.050 --> 00:04:59.590
Si prega di come e iscriversi,

00:04:59.590 --> 00:05:02.150
commentare il video
se vuoi che facciamo

00:05:02.150 --> 00:05:06.360
registrare qualcos'altro e la speranza
per vederti la prossima volta. Grazie.

00:05:06.360 --> 00:05:20.860
[MUSICA]

