WEBVTT

00:00:00.000 --> 00:00:03.000
>> SQL Server 2019 Big
Los clústeres de datos proporcionan

00:00:03.000 --> 00:00:06.585
calcular grupos de cálculo para descargar
procesamiento de consultas distribuidas.

00:00:06.585 --> 00:00:10.350
UC está aquí para contarnos todo sobre
esta hoy en Data Exposed.

00:00:10.350 --> 00:00:21.060
[MUSICA]

00:00:21.060 --> 00:00:25.215
>> Hola. Bienvenidos a otro episodio
de datos expuestos. Soy Jeroen.

00:00:25.215 --> 00:00:27.810
Hoy, me acompañan uc
para hablar de computación

00:00:27.810 --> 00:00:30.690
grupos de servidores en SQL Server
Clústeres de Big Data 2019.

00:00:30.690 --> 00:00:33.000
Hola, UC. Gracias por
unirse al espectáculo de nuevo.

00:00:33.000 --> 00:00:34.155
>> Claro.

00:00:34.155 --> 00:00:36.060
>> ¿Grupos de cómputo?

00:00:36.060 --> 00:00:36.615
>> Sí.

00:00:36.615 --> 00:00:37.815
>> ¿Qué son?

00:00:37.815 --> 00:00:40.980
>> Calcular grupos. Son

00:00:40.980 --> 00:00:44.430
básicamente instancias de SQL Server
en un clúster de big data,

00:00:44.430 --> 00:00:48.725
que se puede utilizar para descargar su
procesamiento de consultas distribuidas.

00:00:48.725 --> 00:00:50.310
Así que en esta imagen,

00:00:50.310 --> 00:00:54.870
vemos los muchos componentes en
un clúster de Big Data de SQL Server.

00:00:54.870 --> 00:00:58.570
Hoy, vamos a ver
este grupo de cómputo por aquí.

00:00:58.570 --> 00:01:01.710
Entonces, ¿qué pasa? Es
básicamente un conjunto de

00:01:01.710 --> 00:01:03.825
Instancias de SQL Server que son

00:01:03.825 --> 00:01:06.685
automáticamente folleto
dentro de un clúster de big data,

00:01:06.685 --> 00:01:10.475
y están disponibles para
realizar consultas distribuidas.

00:01:10.475 --> 00:01:11.405
>> Está bien.

00:01:11.405 --> 00:01:14.030
>> Esto es similar a la PolyBase

00:01:14.030 --> 00:01:17.585
Grupos de escalabilidad horizontal en SQL Server 2016.

00:01:17.585 --> 00:01:21.490
Esta capacidad ahora le proporciona

00:01:21.490 --> 00:01:25.174
conjunto de instancias SQL lista para usar,

00:01:25.174 --> 00:01:27.890
que puede hacer la mayor parte de la
trabajo distribuido para usted.

00:01:27.890 --> 00:01:28.930
>> Está bien.

00:01:28.930 --> 00:01:32.540
>> Las consultas pueden usar
el grupo de cómputo o no utilizar

00:01:32.540 --> 00:01:35.540
el grupo de cómputo dependiendo
en el tipo de consulta.

00:01:35.540 --> 00:01:38.570
>> ¿Qué escenario me gustaría
elegir para un grupo de proceso?

00:01:38.570 --> 00:01:40.720
>> Sí. Gran
Pregunta. Así que vamos a ver.

00:01:40.720 --> 00:01:44.270
Uno de los escenarios comunes es
dicen que tiene dos directorios en

00:01:44.270 --> 00:01:45.950
HDFS con cientos y miles de

00:01:45.950 --> 00:01:48.355
archivos y desea unirse a ellos.

00:01:48.355 --> 00:01:50.000
Así que en ese escenario,

00:01:50.000 --> 00:01:53.390
usted no quiere obtener todos los
datos a su SQL Server.

00:01:53.390 --> 00:01:53.720
>> No.

00:01:53.720 --> 00:01:55.760
>> Que está ejecutando la aplicación.

00:01:55.760 --> 00:01:57.785
Así que ahí es donde el
grupo de computación ayuda.

00:01:57.785 --> 00:02:02.270
Por lo que puede descargar la mayoría de
el trabajo al HDFS

00:02:02.270 --> 00:02:03.680
y luego tirar

00:02:03.680 --> 00:02:07.490
los datos necesarios para el proceso
piscina y hacer la unión allí.

00:02:07.490 --> 00:02:09.920
Así que esto básicamente los descarga a todos,

00:02:09.920 --> 00:02:13.520
el mundo de la computación a diferentes
Máquinas de SQL Server que pueden ser

00:02:13.520 --> 00:02:17.545
en diferentes nodos en
ese cluster de big data,

00:02:17.545 --> 00:02:19.895
y utilizar esos recursos.

00:02:19.895 --> 00:02:21.590
Luego los otros escenarios,

00:02:21.590 --> 00:02:23.570
se está uniendo datos de

00:02:23.570 --> 00:02:26.780
diferentes fuentes de datos que
se particionan de manera diferente.

00:02:26.780 --> 00:02:31.760
Así que ahí tienes que unificar que
particionamiento en algún momento,

00:02:31.760 --> 00:02:33.530
y ahí es donde el
grupo de computación ayuda.

00:02:33.530 --> 00:02:34.145
>> Está bien.

00:02:34.145 --> 00:02:36.710
>> Por lo tanto, si una tabla es distribuida por

00:02:36.710 --> 00:02:40.465
Id. de cliente y otro es
distribuido por idde de pedido,

00:02:40.465 --> 00:02:43.400
y todavía estás
uniéndose por ID de cliente,

00:02:43.400 --> 00:02:46.590
puede hacer eso
reconciliación para usted.

00:02:46.590 --> 00:02:47.400
>> Está bien.

00:02:47.400 --> 00:02:50.070
>> Así que esos son algunos de los escenarios.

00:02:50.070 --> 00:02:54.259
También puede hacer cosas como
exportando datos a HDFS,

00:02:54.259 --> 00:02:56.930
y ese es otro lugar
donde el grupo de proceso puede ayudar.

00:02:56.930 --> 00:02:59.090
>> Está bien. Así que la computación
piscina me ayudará a

00:02:59.090 --> 00:03:01.550
paralelizar, escalar horizontalmente
mi [inaudible].

00:03:01.550 --> 00:03:02.185
>> Sí.

00:03:02.185 --> 00:03:05.430
>> Tanto la lectura de HDFS
y escribir a HDFS en absoluto?

00:03:05.430 --> 00:03:06.030
>> Sí.

00:03:06.030 --> 00:03:07.350
>> Genial. ¿Cómo funciona eso?

00:03:07.350 --> 00:03:09.300
Quiero decir, ¿puede mostrarnos un
un poco de cómo funciona?

00:03:09.300 --> 00:03:12.605
>> Sí. Seguro. Vamos aquí.

00:03:12.605 --> 00:03:16.885
En realidad estoy conectado a un
Clúster de Big Data de SQL Server,

00:03:16.885 --> 00:03:19.655
y específicamente el Masterizado
instancia se muestra aquí.

00:03:19.655 --> 00:03:22.280
Así que ahora tenemos un nuevo DMV,

00:03:22.280 --> 00:03:24.775
que se denomina grupos de proceso.

00:03:24.775 --> 00:03:25.545
>> Está bien.

00:03:25.545 --> 00:03:28.610
>> Básicamente, muestra
los grupos de cómputo que

00:03:28.610 --> 00:03:31.955
están provisión y disponibles
en el clúster de Big Data.

00:03:31.955 --> 00:03:35.960
Por defecto, sólo hay uno y
mostramos esa información aquí.

00:03:35.960 --> 00:03:38.110
Entonces también se puede ver

00:03:38.110 --> 00:03:42.465
cuántos nodos son realmente
allí en el grupo de proceso.

00:03:42.465 --> 00:03:44.740
Esta consulta muestra realmente,

00:03:44.740 --> 00:03:47.525
aparte de este particular
Instancia de SQL Server,

00:03:47.525 --> 00:03:49.100
Tengo dos computación

00:03:49.100 --> 00:03:52.730
instancias de grupo como se muestra por
estas filas resaltadas, ¿verdad?

00:03:52.730 --> 00:03:53.405
>> Sí.

00:03:53.405 --> 00:03:57.815
>> Hay otros DMV que
se puede utilizar para básicamente encontrar

00:03:57.815 --> 00:04:03.195
información sobre la computación
piscina como cómo es la actividad de la CPU,

00:04:03.195 --> 00:04:05.745
la cantidad de memoria que se ha asignado,

00:04:05.745 --> 00:04:09.900
si incluso está disponible para
la consulta y así sucesivamente, ¿verdad?

00:04:09.900 --> 00:04:10.200
>> Correcto.

00:04:10.200 --> 00:04:12.470
>> Estas son informaciones
que un DBA puede

00:04:12.470 --> 00:04:15.095
para solucionar problemas de grupo de proceso.

00:04:15.095 --> 00:04:16.145
>> Claro.

00:04:16.145 --> 00:04:20.480
>> Además, puede
ejecutar una consulta compleja en

00:04:20.480 --> 00:04:25.955
SQL Server que en realidad puede
ir y usar el grupo de proceso.

00:04:25.955 --> 00:04:26.270
>> Está bien.

00:04:26.270 --> 00:04:27.565
>> Así que en este ejemplo,

00:04:27.565 --> 00:04:32.869
Me estoy uniendo a una tabla local en SQL
Servidor con algunos datos en HDFS,

00:04:32.869 --> 00:04:37.070
y también tengo una mesa en
Oracle, que estoy consultando.

00:04:37.070 --> 00:04:40.265
Así que básicamente se puede ejecutar una consulta y

00:04:40.265 --> 00:04:42.290
el optimizador de consultas
cifras automáticas

00:04:42.290 --> 00:04:44.570
cómo usar el grupo de proceso.

00:04:44.570 --> 00:04:47.630
En este caso, se va a
utilizar el grupo de computadoras para

00:04:47.630 --> 00:04:50.930
su mesa HDFS y

00:04:50.930 --> 00:04:54.490
el resto de los datos es
todos se unieron y regresaron.

00:04:54.490 --> 00:04:57.030
Ese es un ejemplo
donde un grupo de cómputo

00:04:57.030 --> 00:05:00.060
transparente trabaja para
obtener los resultados para usted.

00:05:00.060 --> 00:05:01.755
>> Genial. Eso se ve muy bien.

00:05:01.755 --> 00:05:04.220
Básicamente, puedo escribir esta consulta.

00:05:04.220 --> 00:05:07.040
Ahora puedo confiar en el
grupo de computación hará paso

00:05:07.040 --> 00:05:10.010
en donde tiene sentido
optimizar el rendimiento, ¿correcto?

00:05:10.010 --> 00:05:10.535
>> Sí.

00:05:10.535 --> 00:05:13.115
>> Impresionante. Bueno, gracias.
mucho para compartir.

00:05:13.115 --> 00:05:14.015
>> Claro.

00:05:14.015 --> 00:05:15.500
>> Espero que esto haya sido útil.

00:05:15.500 --> 00:05:20.150
Por favor, me gusta o suscribirse
al video y comentario.

00:05:20.150 --> 00:05:22.340
Espero verte la próxima vez.
Gracias por mirar.

00:05:22.340 --> 00:05:36.910
[MUSICA]

