WEBVTT

00:00:00.000 --> 00:00:03.000
>> Servidor SQL 2019 Grande
Os clusters de dados fornecem

00:00:03.000 --> 00:00:06.585
piscinas de computação para descarregar
processamento de consultas distribuídas.

00:00:06.585 --> 00:00:10.350
Uc está aqui para nos contar tudo sobre
isso hoje em Dados Expostos.

00:00:10.350 --> 00:00:21.060
[MÚSICA]

00:00:21.060 --> 00:00:25.215
>> Oi. Bem-vindo a outro episódio
de Dados Expostos. Eu sou Jeroen.

00:00:25.215 --> 00:00:27.810
Hoje, estou acompanhado pela UC
para falar sobre computação

00:00:27.810 --> 00:00:30.690
piscinas no servidor SQL
Clusters de Big Data de 2019.

00:00:30.690 --> 00:00:33.000
Oi, UC. Obrigado por
juntando-se ao show novamente.

00:00:33.000 --> 00:00:34.155
>> Claro.

00:00:34.155 --> 00:00:36.060
>> Piscinas de computação?

00:00:36.060 --> 00:00:36.615
>> Sim.

00:00:36.615 --> 00:00:37.815
>> O que são eles?

00:00:37.815 --> 00:00:40.980
>> Piscinas de computação. Eles são

00:00:40.980 --> 00:00:44.430
basicamente instâncias do servidor SQL
em um cluster de big data,

00:00:44.430 --> 00:00:48.725
que pode ser usado para descarregar o seu
processamento de consultas distribuídas.

00:00:48.725 --> 00:00:50.310
Então, nesta foto,

00:00:50.310 --> 00:00:54.870
vemos os muitos componentes em
um Cluster de Big Data do Servidor SQL.

00:00:54.870 --> 00:00:58.570
Hoje, vamos olhar para
esta piscina de computação por aqui.

00:00:58.570 --> 00:01:01.710
Então, o que é isso? É como eu não sei.
basicamente um conjunto de

00:01:01.710 --> 00:01:03.825
Instâncias do servidor SQL que são

00:01:03.825 --> 00:01:06.685
automaticamente folheto
dentro de um cluster de big data,

00:01:06.685 --> 00:01:10.475
e eles estão disponíveis para
fazendo uma pergunta distribuída.

00:01:10.475 --> 00:01:11.405
>> Ok.

00:01:11.405 --> 00:01:14.030
>> Isso é semelhante ao PolyBase

00:01:14.030 --> 00:01:17.585
Grupos de escala no Servidor SQL 2016.

00:01:17.585 --> 00:01:21.490
Esta capacidade agora fornece-lhe

00:01:21.490 --> 00:01:25.174
conjunto fora da caixa de instâncias SQL,

00:01:25.174 --> 00:01:27.890
que pode fazer a maior parte do
trabalho distribuído para você.

00:01:27.890 --> 00:01:28.930
>> Ok.

00:01:28.930 --> 00:01:32.540
>> Consultas podem usar
o pool de computação ou não usar

00:01:32.540 --> 00:01:35.540
o pool de computação, dependendo
sobre o tipo de consulta.

00:01:35.540 --> 00:01:38.570
>> Que cenário eu seria
escolher para uma piscina de computação?

00:01:38.570 --> 00:01:40.720
>> Sim. Legal
Pergunta. Então, vamos ver.

00:01:40.720 --> 00:01:44.270
Um dos cenários comuns é
digamos que você tem dois diretórios em

00:01:44.270 --> 00:01:45.950
HDFS com centenas e milhares de

00:01:45.950 --> 00:01:48.355
arquivos e você quer se juntar a eles.

00:01:48.355 --> 00:01:50.000
Então, nesse cenário,

00:01:50.000 --> 00:01:53.390
você não quer obter todos os
dados para o seu servidor SQL.

00:01:53.390 --> 00:01:53.720
>> Não.

00:01:53.720 --> 00:01:55.760
>> Que está executando o seu pedido.

00:01:55.760 --> 00:01:57.785
Então é aí que o
piscina de computação ajuda.

00:01:57.785 --> 00:02:02.270
Assim, ele pode descarregar a maior parte do
o trabalho para o HDFS

00:02:02.270 --> 00:02:03.680
e depois puxar

00:02:03.680 --> 00:02:07.490
os dados necessários para a computação
piscina e fazer a juntar-se lá.

00:02:07.490 --> 00:02:09.920
Então isso basicamente descarrega todos eles,

00:02:09.920 --> 00:02:13.520
o mundo da computação para diferentes
Máquinas de servidor sql que podem ser

00:02:13.520 --> 00:02:17.545
em diferentes nós em
que o cluster de big data,

00:02:17.545 --> 00:02:19.895
e usar esses recursos.

00:02:19.895 --> 00:02:21.590
Em seguida, os outros cenários,

00:02:21.590 --> 00:02:23.570
você está juntando dados de

00:02:23.570 --> 00:02:26.780
diferentes fontes de dados que
são se parado de forma diferente.

00:02:26.780 --> 00:02:31.760
Então, aí você tem que unificar isso
partição em algum momento,

00:02:31.760 --> 00:02:33.530
e é aí que o
piscina de computação ajuda.

00:02:33.530 --> 00:02:34.145
>> Ok.

00:02:34.145 --> 00:02:36.710
>> Então, se uma tabela é distribuída por

00:02:36.710 --> 00:02:40.465
Identificação do cliente e outra é
distribuído pela Ordem ID,

00:02:40.465 --> 00:02:43.400
e você ainda está
ingressando pelo Customer ID,

00:02:43.400 --> 00:02:46.590
ele pode fazer isso
reconciliação para você.

00:02:46.590 --> 00:02:47.400
>> Ok.

00:02:47.400 --> 00:02:50.070
>> Então esse é alguns dos cenários.

00:02:50.070 --> 00:02:54.259
Você também pode fazer coisas como
exportação de dados para hdfs,

00:02:54.259 --> 00:02:56.930
e isso é outro lugar.
onde a piscina de computação pode ajudar.

00:02:56.930 --> 00:02:59.090
>> Ok. Assim, a computação
piscina vai me ajudar a

00:02:59.090 --> 00:03:01.550
paralelor, ampliação
meu [inaudível].

00:03:01.550 --> 00:03:02.185
>> Sim.

00:03:02.185 --> 00:03:05.430
>> Ambos lendo do HDFS
e escrever para HDFS em tudo?

00:03:05.430 --> 00:03:06.030
>> Sim.

00:03:06.030 --> 00:03:07.350
>> Legal. Como é que isso funciona?

00:03:07.350 --> 00:03:09.300
Quer dizer, você pode nos mostrar um
pouco de como isso funciona?

00:03:09.300 --> 00:03:12.605
>> Sim. Certeza. Vamos aqui.

00:03:12.605 --> 00:03:16.885
Na verdade, estou ligado a um
Cluster de big data do servidor SQL,

00:03:16.885 --> 00:03:19.655
e especificamente o Mastered
exemplo é mostrado aqui.

00:03:19.655 --> 00:03:22.280
Então, agora temos um novo Detran,

00:03:22.280 --> 00:03:24.775
que é chamado de piscinas de computação.

00:03:24.775 --> 00:03:25.545
>> Ok.

00:03:25.545 --> 00:03:28.610
>> Basicamente, ele mostra
as piscinas de computação que

00:03:28.610 --> 00:03:31.955
estão provisionados e disponíveis
no Cluster de Big Data.

00:03:31.955 --> 00:03:35.960
Por padrão, há apenas um e
mostramos essa informação aqui.

00:03:35.960 --> 00:03:38.110
Então você também pode ver

00:03:38.110 --> 00:03:42.465
quantos nós são realmente
lá na piscina de computação.

00:03:42.465 --> 00:03:44.740
Esta consulta realmente mostra,

00:03:44.740 --> 00:03:47.525
para além deste
Instância do servidor SQL,

00:03:47.525 --> 00:03:49.100
Eu tenho dois cálculos

00:03:49.100 --> 00:03:52.730
casos de piscina, como mostrado por
estas linhas destacadas, certo?

00:03:52.730 --> 00:03:53.405
>> Sim.

00:03:53.405 --> 00:03:57.815
>> Existem outros DMVs que
você pode usar para basicamente encontrar

00:03:57.815 --> 00:04:03.195
informações sobre a computação
piscina como a atividade da CPU,

00:04:03.195 --> 00:04:05.745
quanta memória foi alocada,

00:04:05.745 --> 00:04:09.900
se ele está mesmo disponível para
a consulta e assim por diante, certo?

00:04:09.900 --> 00:04:10.200
>> Certo.

00:04:10.200 --> 00:04:12.470
>> Estas são informações
que um DBA pode

00:04:12.470 --> 00:04:15.095
usar para solucionar problemas de computação piscina.

00:04:15.095 --> 00:04:16.145
>> Claro.

00:04:16.145 --> 00:04:20.480
>> Além disso, você pode
executar uma consulta complexa em

00:04:20.480 --> 00:04:25.955
Servidor SQL que pode realmente
ir e usar a piscina de computação.

00:04:25.955 --> 00:04:26.270
>> Ok.

00:04:26.270 --> 00:04:27.565
>> Então, neste exemplo,

00:04:27.565 --> 00:04:32.869
Estou me juntando a uma mesa local em SQL
Servidor com alguns dados no HDFS,

00:04:32.869 --> 00:04:37.070
e eu também tenho uma mesa em
Oracle, que eu estou consultando.

00:04:37.070 --> 00:04:40.265
Então você pode basicamente executar uma consulta e

00:04:40.265 --> 00:04:42.290
o otimizador de consultas
números automáticos

00:04:42.290 --> 00:04:44.570
fora como usar o pool de computação.

00:04:44.570 --> 00:04:47.630
Neste caso, vai
usar a piscina de computador para

00:04:47.630 --> 00:04:50.930
sua tabela HDFS e

00:04:50.930 --> 00:04:54.490
o resto dos dados é
todos se juntaram e voltaram.

00:04:54.490 --> 00:04:57.030
Esse é um exemplo.
onde uma piscina de computação

00:04:57.030 --> 00:05:00.060
trabalha de forma transparente para
obter os resultados para você.

00:05:00.060 --> 00:05:01.755
>> Legal. Isso parece muito bom.

00:05:01.755 --> 00:05:04.220
Basicamente, eu posso escrever esta consulta.

00:05:04.220 --> 00:05:07.040
Agora posso confiar no
piscina de computação vai dar passo

00:05:07.040 --> 00:05:10.010
em que faz sentido
otimizar o desempenho, correto?

00:05:10.010 --> 00:05:10.535
>> Sim.

00:05:10.535 --> 00:05:13.115
>> Impressionante. Obrigado.
muito para compartilhar.

00:05:13.115 --> 00:05:14.015
>> Claro.

00:05:14.015 --> 00:05:15.500
>> Espero que isso tenha sido útil.

00:05:15.500 --> 00:05:20.150
Por favor, como ou se inscrever
para o vídeo e comentar.

00:05:20.150 --> 00:05:22.340
Espero vê-lo da próxima vez.
Obrigado por assistir.

00:05:22.340 --> 00:05:36.910
[MÚSICA]

