WEBVTT

00:00:00.000 --> 00:00:03.070
>> Servidor SQL 2019 grande
os clusters de dados fornecem

00:00:03.070 --> 00:00:04.950
Conjuntos de dados para otimizar

00:00:04.950 --> 00:00:07.905
desempenho de consulta ao chegar
para várias fontes.

00:00:07.905 --> 00:00:10.080
Umachandar está aqui com
hoje para nos contar a todos

00:00:10.080 --> 00:00:12.450
sobre isso hoje em Dados Expostos.

00:00:12.450 --> 00:00:23.550
[MÚSICA].

00:00:23.550 --> 00:00:26.250
>> Oi e bem-vindo a outro
episódio de Dados Expostos.

00:00:26.250 --> 00:00:29.100
Eu sou seu anfitrião Jeroen e
hoje temos que ver os nós

00:00:29.100 --> 00:00:32.085
para falar sobre pools de dados
nos clusters de big data da SQL.

00:00:32.085 --> 00:00:33.675
Hi Umachandar bem-vindo ao show.

00:00:33.675 --> 00:00:35.460
>> Oi, estou feliz por estar aqui.

00:00:35.460 --> 00:00:38.160
>> Então pools de dados em
grandes clusters de dados.

00:00:38.160 --> 00:00:40.505
O que é? O que eu preciso saber?

00:00:40.505 --> 00:00:42.440
>> Claro que sim, deixe-me começar rapidamente

00:00:42.440 --> 00:00:45.110
mostrando o que um
O Big Data Cluster é.

00:00:45.110 --> 00:00:48.090
Portanto, este slide mostra a implantação de

00:00:48.090 --> 00:00:52.110
SQL Server 19 Big Data
Cluster e hoje estamos

00:00:52.110 --> 00:00:56.360
vai falar sobre os dados
Piscinas aqui que são basicamente

00:00:56.360 --> 00:00:59.300
duas instâncias de servidor SQL que podem ser

00:00:59.300 --> 00:01:02.960
usado para descarregar alguns
consulta [inaudível].

00:01:02.960 --> 00:01:04.810
Então vamos ver o que é um pool de dados.

00:01:04.810 --> 00:01:08.390
Portanto, é basicamente servidor SQL
armazenamento e computação que é

00:01:08.390 --> 00:01:13.550
fornecido para escrever as consultas
e armazenar dados no Pool de dados.

00:01:13.550 --> 00:01:16.310
Ele pode ser manipulado por execução

00:01:16.310 --> 00:01:20.900
algumas operações externas da tabela
nele e você povoa dados

00:01:20.900 --> 00:01:24.440
no Pool de Dados e
mais tarde, você pode realmente

00:01:24.440 --> 00:01:28.970
descarregar um pouco de sua análise
consultas sobre a este pool de dados.

00:01:28.970 --> 00:01:32.400
Então essa é a primária
propósito do Pool de Dados.

00:01:32.400 --> 00:01:37.140
Então, agora vamos ser rapidamente tomar
um olhar sobre alguns dos cenários.

00:01:37.140 --> 00:01:39.980
Então o cenário comum é que você está

00:01:39.980 --> 00:01:42.710
obtenção de dados de
diferentes fontes de dados,

00:01:42.710 --> 00:01:44.570
alguns deles são rápidos,

00:01:44.570 --> 00:01:47.345
outros são mais lentos na natureza.

00:01:47.345 --> 00:01:51.050
Então, agora você quer basicamente otimizar

00:01:51.050 --> 00:01:55.535
esta consulta para que você pudesse
realmente tomar essa consulta

00:01:55.535 --> 00:02:00.350
e armazenar os resultados no
O Pool de dados e isso permite que você

00:02:00.350 --> 00:02:02.900
basicamente, use isso como

00:02:02.900 --> 00:02:07.300
uma área de preparação onde você
pode executar todas as suas análises.

00:02:07.300 --> 00:02:10.830
O outro exemplo é se você está
fazendo aprendizado de máquina,

00:02:10.830 --> 00:02:12.830
há um monte de
cenários onde você

00:02:12.830 --> 00:02:14.960
geraria recursos
e centenas e

00:02:14.960 --> 00:02:18.290
milhares de recursos e
você quer basicamente armazenar

00:02:18.290 --> 00:02:23.040
o conjunto de dados em um lugar onde
você pode fazer análises repetidas.

00:02:23.040 --> 00:02:26.145
É outro lugar onde
o Pool de Dados ajuda.

00:02:26.145 --> 00:02:29.540
>> Então, nesse caso, não é
apenas para otimização de consultas

00:02:29.540 --> 00:02:31.190
mas também para ter certeza
você não tem que ir

00:02:31.190 --> 00:02:32.975
de volta à fonte de dados
O tempo todo, certo?

00:02:32.975 --> 00:02:33.230
>> Sim.

00:02:33.230 --> 00:02:34.385
>> Se você quiser reutilizar os dados.

00:02:34.385 --> 00:02:34.625
>> Sim.

00:02:34.625 --> 00:02:35.660
>> Legal, isso soa muito legal.

00:02:35.660 --> 00:02:37.355
Então, você pode realmente
nos mostrar como isso funciona?

00:02:37.355 --> 00:02:40.550
>> Sim, vamos rapidamente
para avaliar quanto está aqui.

00:02:40.550 --> 00:02:42.230
Então o que eu tenho aqui é

00:02:42.230 --> 00:02:45.530
uma conexão com o SQL
Cluster de big data do servidor.

00:02:45.530 --> 00:02:48.890
Estou ligado ao SQL
Instância mestre do servidor.

00:02:48.890 --> 00:02:51.905
Assim, a maneira de criar um pool de dados

00:02:51.905 --> 00:02:55.625
é o primeiro, criando
este objeto de fonte de dados.

00:02:55.625 --> 00:02:58.100
Então aqui como este nome indica

00:02:58.100 --> 00:03:01.325
aqui isso basicamente diz o que
tipo de fonte de dados que é.

00:03:01.325 --> 00:03:04.400
Então, isso eu vou
conectar-se a um pool de dados.

00:03:04.400 --> 00:03:05.530
>> Ok.

00:03:05.530 --> 00:03:08.780
>> É assim que você
criá-lo. Depois disso

00:03:08.780 --> 00:03:11.360
você define a tabela
que você quer

00:03:11.360 --> 00:03:13.940
loja nos dados
Piscina e isso é feito

00:03:13.940 --> 00:03:16.670
executando este externo
declaração de mesa.

00:03:16.670 --> 00:03:17.845
>> Ok.

00:03:17.845 --> 00:03:21.090
>> Isso se parece com o seu regular
criar declaração de tabela,

00:03:21.090 --> 00:03:24.110
há colunas que
você precisa definir e em

00:03:24.110 --> 00:03:27.725
além, uma vez que existem muitos SQL
instâncias de servidor no backend.

00:03:27.725 --> 00:03:28.115
>> Certo.

00:03:28.115 --> 00:03:30.740
>> Você só precisa dizer como você
quer distribuir os dados.

00:03:30.740 --> 00:03:32.630
>> Então, com isso você pode dizer, ok,

00:03:32.630 --> 00:03:36.155
então, temos um mesmo ou aproximadamente
até a distribuição.

00:03:36.155 --> 00:03:36.515
>> Sim.

00:03:36.515 --> 00:03:37.400
>> Em todo o serviço.

00:03:37.400 --> 00:03:37.685
>> Sim.

00:03:37.685 --> 00:03:38.000
>> Ok.

00:03:38.000 --> 00:03:41.330
>> Então é isso que o round robin
faz é basicamente distribuir

00:03:41.330 --> 00:03:44.825
os dados em quantos de
Instâncias do Pool de dados que você tem.

00:03:44.825 --> 00:03:45.865
>> Ok.

00:03:45.865 --> 00:03:49.370
>> A próxima coisa que você pode
fazer é como consultar os dados.

00:03:49.370 --> 00:03:50.780
Então, vamos primeiro olhar para alguns dos

00:03:50.780 --> 00:03:54.155
os dados da amostra em
este exemplo que tenho em

00:03:54.155 --> 00:03:57.680
Diretório hdfs e, basicamente,

00:03:57.680 --> 00:04:00.155
Eu quero levar estes
dados clickstream,

00:04:00.155 --> 00:04:04.490
fazer alguma consulta e povoar
no Pool de Dados.

00:04:04.490 --> 00:04:08.915
A maneira que você faria é por
executando apenas uma declaração de inserção.

00:04:08.915 --> 00:04:13.490
Assim, a fonte da inserção
declaração é apenas uma consulta SQL,

00:04:13.490 --> 00:04:18.140
e você pode simplesmente executar o
consultar e preencher os dados.

00:04:18.140 --> 00:04:21.320
Eu não vou correr através do
inserções, mas vamos rapidamente

00:04:21.320 --> 00:04:25.205
ver os dados que já estão
povoado no Pool de Dados.

00:04:25.205 --> 00:04:28.445
Portanto, esta consulta deve retornar
cerca de 2.000 linhas, certo?

00:04:28.445 --> 00:04:32.930
Então, agora, como qualquer outro
tabela que você pode realmente participar

00:04:32.930 --> 00:04:37.460
esta tabela com outras tabelas
em seu servidor SQL e obter

00:04:37.460 --> 00:04:39.680
os resultados e transparente

00:04:39.680 --> 00:04:42.200
esta instância de servidor SQL
vai falar com

00:04:42.200 --> 00:04:47.555
as instâncias do Pool de Dados para serem executadas
as consultas e obter os resultados.

00:04:47.555 --> 00:04:50.330
Então, isso é em um nível elevado
do que é um pool de dados.

00:04:50.330 --> 00:04:51.530
>> Legal incrível.

00:04:51.530 --> 00:04:54.390
Isso é muito impressionante.
Muito obrigado.

00:04:54.390 --> 00:04:55.530
>> Cool sim, obrigado.

00:04:55.530 --> 00:04:58.050
>> Ok. Então, obrigado por assistir.

00:04:58.050 --> 00:04:59.590
Por favor, como e se inscrever,

00:04:59.590 --> 00:05:02.150
comentário sobre o vídeo
se você quer que nós

00:05:02.150 --> 00:05:06.360
gravar outra coisa e esperança
para vê-lo da próxima vez. Thansk.

00:05:06.360 --> 00:05:20.860
[MÚSICA]

