WEBVTT

00:00:00.000 --> 00:00:02.745
>> Los clústeres de big data proporcionan

00:00:02.745 --> 00:00:05.640
una forma de mantener el clúster
fiable habilitando

00:00:05.640 --> 00:00:08.460
alta disponibilidad para la crítica
componentes y Mihaela es

00:00:08.460 --> 00:00:12.120
aquí para contarnos todo acerca de
hoy en día en Data Exposed.

00:00:12.120 --> 00:00:23.400
[MUSICA]

00:00:23.400 --> 00:00:26.475
>> Hola, y bienvenidos a otro
episodio de Data Exposed.

00:00:26.475 --> 00:00:30.480
Soy tu anfitrión Jeroen y hoy
tenemos a Mihaela con nosotros para hablar

00:00:30.480 --> 00:00:32.265
sobre los clústeres de big data y luego

00:00:32.265 --> 00:00:34.970
específicamente el alto
disponibilidad para ellos.

00:00:34.970 --> 00:00:37.655
Así que bienvenidos de nuevo. Esto es imprescindible
ser la cuarta vez que creo.

00:00:37.655 --> 00:00:39.560
>> Sí. Gracias. Gracias
por tenerme aquí.

00:00:39.560 --> 00:00:40.985
>> Sí. Te estás convirtiendo en una sonda.

00:00:40.985 --> 00:00:43.550
Así que la mayoría de los temas que hablas

00:00:43.550 --> 00:00:46.445
acerca de es clústeres de big data
y hoy no es diferente.

00:00:46.445 --> 00:00:48.345
Pero entonces alta disponibilidad, ¿verdad?

00:00:48.345 --> 00:00:50.780
>> Sí. Así que hay
un montón de cosas para

00:00:50.780 --> 00:00:53.360
hablar de cuando se trata de
a alta disponibilidad.

00:00:53.360 --> 00:00:54.155
>> Está bien.

00:00:54.155 --> 00:00:57.590
>> Vamos a pasar por algunos
de esos aspectos en este video.

00:00:57.590 --> 00:00:59.785
>> Está bien. Fresco. Ahora empecemos.

00:00:59.785 --> 00:01:05.745
>> Así que cuando hablamos de datos
especialmente y las bases de datos,

00:01:05.745 --> 00:01:07.800
queremos asegurarnos de que
los datos son la persistencia.

00:01:07.800 --> 00:01:09.110
Así que sólo quiero empezar con

00:01:09.110 --> 00:01:13.430
esta charla de alta disponibilidad
con el resumen de almacenamiento.

00:01:13.430 --> 00:01:13.650
>> Está bien.

00:01:13.650 --> 00:01:14.850
>> Así que diferentes capas en

00:01:14.850 --> 00:01:17.840
el clúster de big data han
diferentes opciones de almacenamiento.

00:01:17.840 --> 00:01:20.180
Puede hacer un almacenamiento local o

00:01:20.180 --> 00:01:23.150
remoto y lo hicimos tan granular como

00:01:23.150 --> 00:01:25.970
puede optar por el local o remoto

00:01:25.970 --> 00:01:28.895
dependiendo de si desea
almacenar datos o los registros.

00:01:28.895 --> 00:01:33.680
Así que los registros que no quieres
necesariamente para que sea redundante

00:01:33.680 --> 00:01:36.865
porque es posible que lo necesite para

00:01:36.865 --> 00:01:40.930
solución de problemas, pero luego
no quiero conservarlos para siempre.

00:01:41.090 --> 00:01:42.190
>> [inaudible].

00:01:42.190 --> 00:01:44.840
>> Exactamente. Así que cuando
hablamos de registros es

00:01:44.840 --> 00:01:48.140
sobre todo quieres mantener
ellos en un almacenamiento local

00:01:48.140 --> 00:01:52.355
especialmente porque estábamos hablando
en el último video que tenemos

00:01:52.355 --> 00:01:54.590
componentes en los clústeres que son

00:01:54.590 --> 00:01:57.410
recoger esos registros y son
iniciarlos en una búsqueda elástica.

00:01:57.410 --> 00:02:01.615
Así que ya tienes algunos
dependencia de ese aspecto.

00:02:01.615 --> 00:02:04.410
Cuando se trata de datos,
diversos componentes

00:02:04.410 --> 00:02:08.270
tienen diferentes requisitos
dependiendo de cómo

00:02:08.270 --> 00:02:10.730
una misión crítica son y si hay

00:02:10.730 --> 00:02:15.140
los datos de usuario que se almacenan
en busca de datos, por ejemplo,

00:02:15.140 --> 00:02:20.030
Sql ServerSQL Server maestro o almacenamiento
como se conservan los datos HDFS.

00:02:20.030 --> 00:02:22.955
Desea mantener
redundancia para eso.

00:02:22.955 --> 00:02:28.445
Pero Compute pool o Spark,

00:02:28.445 --> 00:02:30.695
no hay estado.

00:02:30.695 --> 00:02:33.380
Es sólo computación.
Así que no tiene sentido

00:02:33.380 --> 00:02:36.560
para añadir
redundancia del almacenamiento.

00:02:36.560 --> 00:02:38.225
>> Exactamente. Así que usted puede elegir local.

00:02:38.225 --> 00:02:39.470
>> Así que estamos hablando aquí sobre

00:02:39.470 --> 00:02:42.260
diferentes opciones que
usted tiene que asegurarse de

00:02:42.260 --> 00:02:44.810
la fiabilidad de esos servicios

00:02:44.810 --> 00:02:46.400
cuando se trata de la persistencia de datos.

00:02:46.400 --> 00:02:47.620
>> Está bien.

00:02:47.620 --> 00:02:51.575
>> Ahí es donde continuamos
con las opciones de HA, ¿verdad?

00:02:51.575 --> 00:02:55.985
Por lo tanto, para SQL Server master si su
historia en sus datos localmente,

00:02:55.985 --> 00:02:57.725
usted debe asegurarse de que usted está agregando

00:02:57.725 --> 00:02:59.675
una redundancia adicional a que

00:02:59.675 --> 00:03:01.340
con Grupos de Disponibilidad
y vamos a

00:03:01.340 --> 00:03:04.160
ver en breve cómo está habilitado.

00:03:04.160 --> 00:03:05.990
Cuando se trata de Grupo de datos,

00:03:05.990 --> 00:03:13.970
utiliza PVs en combinadores para
asegurarse de que los datos son persistentes.

00:03:13.970 --> 00:03:15.350
>> Así que son sólo PVs, ¿verdad?

00:03:15.350 --> 00:03:16.505
Hay muchas siglas aquí.

00:03:16.505 --> 00:03:17.240
>> Sí.

00:03:17.240 --> 00:03:21.110
>> Por ejemplo PV, HA, todo PV es?

00:03:21.110 --> 00:03:25.175
>> Sugiere PVs es
un concepto de Kubernetes

00:03:25.175 --> 00:03:28.250
que abstrae la capa de almacenamiento de

00:03:28.250 --> 00:03:32.090
Kubernetes y asegura que si estás
utilizando volúmenes persistentes.

00:03:32.090 --> 00:03:35.270
Así que la noción es la persistencia de datos.

00:03:35.270 --> 00:03:37.010
Así que si estás usando
volumen persistente es

00:03:37.010 --> 00:03:38.840
significa que Kubernetes garantiza que

00:03:38.840 --> 00:03:42.440
datos se conservan en ese almacenamiento.

00:03:42.440 --> 00:03:43.580
>> Está bien. Entiendo.

00:03:43.580 --> 00:03:46.655
>> Una vez más, eso no es necesario asegurar

00:03:46.655 --> 00:03:49.435
alta disponibilidad para la computación
porque es apátrida.

00:03:49.435 --> 00:03:52.110
Tiene componentes críticos

00:03:52.110 --> 00:03:53.870
en la pila de Hadoop
justo cuando se trata de

00:03:53.870 --> 00:03:56.600
HDFS NameNode y algunos Spark compartidos

00:03:56.600 --> 00:04:00.545
servicios que necesita para
permitir una alta disponibilidad para,

00:04:00.545 --> 00:04:03.020
y muy importante que
quiero destacar aquí

00:04:03.020 --> 00:04:09.000
el Servicio de Control que debe
no sólo tienen volumen persistente,

00:04:09.000 --> 00:04:11.490
es necesario añadir algunos
redundancia a esa historia.

00:04:11.490 --> 00:04:14.135
Así que tiene que ser algunos
almacenamiento redundante remoto.

00:04:14.135 --> 00:04:16.940
No mantengas el control [inaudible]

00:04:16.940 --> 00:04:21.410
localmente porque si eso
el nodo es el último aquí,

00:04:21.410 --> 00:04:23.960
más o menos todo el clúster es
no en un muy limitado.

00:04:23.960 --> 00:04:28.130
>> Está bien. Así que control tiene
¿PVs en un almacenamiento remoto?

00:04:28.130 --> 00:04:29.270
>> Remoto y redundante.

00:04:29.270 --> 00:04:31.100
Así que tienes que hacer
seguro de que añaden

00:04:31.100 --> 00:04:33.005
alguna redundancia a esa capa.

00:04:33.005 --> 00:04:34.710
>> Está bien. Observó.

00:04:34.710 --> 00:04:37.290
>> Así que ahora vamos a ver
lo que eso significa para

00:04:37.290 --> 00:04:41.085
SQL Server sql Server maestro y
habilitando AG's para eso.

00:04:41.085 --> 00:04:45.095
Así que este es un esquema o

00:04:45.095 --> 00:04:50.045
cómo el diseño de diversos servicios
que forman el SQL Server,

00:04:50.045 --> 00:04:55.190
capa de alta disponibilidad
para el maestro de SQL Server.

00:04:55.190 --> 00:04:57.020
Una vez más, tenemos una primaria que

00:04:57.020 --> 00:05:00.785
es por lo menos dos secundarias
sincrónico derecho,

00:05:00.785 --> 00:05:04.670
y construimos componentes que

00:05:04.670 --> 00:05:08.985
están asegurando que hay
es monitoreo automático,

00:05:08.985 --> 00:05:11.370
conmutación automática por error
orquestación.

00:05:11.370 --> 00:05:12.960
Si algo sucede con una primaria,

00:05:12.960 --> 00:05:17.675
sucede automáticamente, no
no es necesario hacer nada.

00:05:17.675 --> 00:05:20.330
Una cosa que quiero
para resaltar aquí es

00:05:20.330 --> 00:05:23.870
que para el clúster de big data
sólo en este momento,

00:05:23.870 --> 00:05:27.755
también habilitamos lo que llamamos un
Grupo de Disponibilidad Contenido,

00:05:27.755 --> 00:05:30.920
lo que significa que ahora los objetos que

00:05:30.920 --> 00:05:33.920
almacenas en el maestro, por ejemplo, como

00:05:33.920 --> 00:05:40.190
inicios de sesión también se replican
a las secundarias, ¿verdad?

00:05:40.190 --> 00:05:40.380
>> Está bien.

00:05:40.380 --> 00:05:43.880
>> Así que hasta ahora esto es
a lo largo nos están enviando desde

00:05:43.880 --> 00:05:45.770
nuestros clientes para hacer
asegurarse de que los inicios de sesión

00:05:45.770 --> 00:05:47.930
también se replican de otra manera,

00:05:47.930 --> 00:05:49.610
hay mucha acusación y

00:05:49.610 --> 00:05:51.935
replicación manual que tenían que hacer.

00:05:51.935 --> 00:05:55.290
Ahora mismo automáticamente
todo está arreglado.

00:05:55.290 --> 00:05:57.060
Así que desde la implementación, desde la adición de

00:05:57.060 --> 00:05:59.130
bases de datos a los grupos de disponibilidad,

00:05:59.130 --> 00:06:05.330
a la adición de este maestro replicado
grupos de disponibilidad de bases de datos.

00:06:05.330 --> 00:06:08.555
Así que hay poco o ninguno

00:06:08.555 --> 00:06:13.130
entre la gestión operativa de

00:06:13.130 --> 00:06:16.620
el grupo de disponibilidad.
Eso es bastante impresionante.

00:06:16.620 --> 00:06:18.660
>> Sí. Eso es realmente
Impresionante. Iba a decir.

00:06:18.660 --> 00:06:21.230
Así que pero usted mencionó
grupos de disponibilidad ahora, ¿verdad?

00:06:21.230 --> 00:06:21.390
>> Sí.

00:06:21.390 --> 00:06:24.330
>> ¿Es eso el habitual?

00:06:24.330 --> 00:06:27.200
>> Sí. Es exactamente
la misma característica que

00:06:27.200 --> 00:06:30.050
todos lo saben de SQL Server 2012, ¿verdad?

00:06:30.050 --> 00:06:30.605
>> Sí.

00:06:30.605 --> 00:06:33.440
>> Una cosa que
Es muy importante.

00:06:33.440 --> 00:06:35.960
No hay otra tecnología de clúster

00:06:35.960 --> 00:06:39.365
que vas a tener que
implementar o integrar con.

00:06:39.365 --> 00:06:41.445
Es todo lo cuidado,

00:06:41.445 --> 00:06:44.590
los servicios que se están implementando
con el supervisor de ha,

00:06:44.590 --> 00:06:45.730
el operador y de

00:06:45.730 --> 00:06:49.840
curso estrechamente integrando con
Kubernetes por escrito este caso.

00:06:49.840 --> 00:06:52.560
Así que estamos aprovechando
de estas plataformas.

00:06:52.560 --> 00:06:54.100
>> Así que no más tecnología de clúster.

00:06:54.100 --> 00:06:56.650
Así que esto es genial para el dominio.

00:06:56.650 --> 00:07:00.510
Así que ahora confío en el maestro
instancias está bien.

00:07:00.510 --> 00:07:02.250
Pero hay más en BDC, ¿verdad?

00:07:02.250 --> 00:07:03.965
No sólo estamos haciendo un SQL Server,

00:07:03.965 --> 00:07:05.980
estamos haciendo [inaudible]
cosas relacionadas.

00:07:05.980 --> 00:07:07.510
Así que dime.

00:07:07.510 --> 00:07:10.230
>> Así que vamos a ver lo que estamos
haciendo por Hadoop, para HDFS.

00:07:10.230 --> 00:07:13.690
Así que HDFS NameNode también debe estar en

00:07:13.690 --> 00:07:16.540
una configuración de alta disponibilidad
porque eso es crítico

00:07:16.540 --> 00:07:20.035
para la pila de Hadoop,

00:07:20.035 --> 00:07:23.205
y lo que estamos viendo que el
cliente nos está diciendo, ''Oh,

00:07:23.205 --> 00:07:26.395
Quiero replicación para NameNode'',

00:07:26.395 --> 00:07:28.640
también desplegaría Zookeeper que

00:07:28.640 --> 00:07:31.430
es una tecnología de clúster de código abierto.

00:07:31.430 --> 00:07:35.750
Ese es el componente que va
para ocuparse de la coordinación

00:07:35.750 --> 00:07:39.800
el monitoreo y la conmutación por error si

00:07:39.800 --> 00:07:44.970
necesario de la NameNode
a un secundario en espera.

00:07:44.970 --> 00:07:45.070
>> Está bien.

00:07:45.070 --> 00:07:47.330
>> Así que la implementación de una réplica adicional

00:07:47.330 --> 00:07:49.985
y Zookeeper está cuidando
del aspecto de orquestación.

00:07:49.985 --> 00:07:50.675
>> Está bien.

00:07:50.675 --> 00:07:55.235
>> Al mismo tiempo
también está involucrado en

00:07:55.235 --> 00:07:58.580
mantener una alta disponibilidad para

00:07:58.580 --> 00:08:03.679
algunos componentes de Spark comparten
como Yarn Resource Manager,

00:08:03.679 --> 00:08:07.520
y en ese sentido para
Spark también implementamos

00:08:07.520 --> 00:08:12.200
múltiples réplicas para servicios
como Historia de chispas, Historial de trabajo.

00:08:12.200 --> 00:08:15.515
Así que para asegurarse de que si algo es

00:08:15.515 --> 00:08:19.900
pasando en OneNote que
estos servicios están alojados,

00:08:19.900 --> 00:08:23.495
El [inaudible] sería elegido
réplicas adicionales o adicionales.

00:08:23.495 --> 00:08:24.790
>> Genial.

00:08:24.790 --> 00:08:28.490
>> Así que vamos a ver lo fácil que es

00:08:28.490 --> 00:08:32.570
configurar la alta disponibilidad
para los diversos componentes.

00:08:32.570 --> 00:08:33.530
>> Dime que es fácil.

00:08:33.530 --> 00:08:35.510
>> Es muy fácil.

00:08:35.510 --> 00:08:38.280
>> Genial. Me gusta lo fácil.

00:08:38.470 --> 00:08:42.740
>> Hablamos la última vez sobre cómo
para configurar las implementaciones.

00:08:42.740 --> 00:08:43.820
>> Sí. Lo recuerdo.

00:08:43.820 --> 00:08:47.270
>> Está el clúster
archivos de configuración

00:08:47.270 --> 00:08:49.675
o plantillas de despliegue
que tienes,

00:08:49.675 --> 00:08:52.280
y recuerde que estamos
hablando antes sobre

00:08:52.280 --> 00:08:55.700
los componentes de recurso compartido de Spark.

00:08:55.700 --> 00:08:56.210
>> Sí.

00:08:56.210 --> 00:08:59.975
>> Sólo digo que sólo quiero dos
réplicas de ellos y eso es todo.

00:08:59.975 --> 00:09:02.060
Nos ocupamos de
recogiendo a partir de ahí.

00:09:02.060 --> 00:09:03.020
>> ¿Eso es todo?

00:09:03.020 --> 00:09:04.610
>> El Cuidador del Zoológico. Así que de nuevo,

00:09:04.610 --> 00:09:08.450
tenemos que pasar por todos los
componentes que pasamos.

00:09:08.450 --> 00:09:12.980
Zookeeper vamos a necesitar
tres réplicas para garantizar el quórum.

00:09:12.980 --> 00:09:16.145
Luego también mencionamos al maestro,

00:09:16.145 --> 00:09:19.465
Instancia maestra de SQL Server
y ¿qué hago aquí?

00:09:19.465 --> 00:09:22.755
Yo sólo diría que
quiero tres réplicas,

00:09:22.755 --> 00:09:26.930
y porque SQL Server
grupos de disponibilidad

00:09:26.930 --> 00:09:28.985
también permite a los secundarios legibles,

00:09:28.985 --> 00:09:31.640
le dará la opción de

00:09:31.640 --> 00:09:36.440
desplegar un servicio que
está exponiendo un punto final

00:09:36.440 --> 00:09:39.920
a la carga de trabajo remotamente

00:09:39.920 --> 00:09:41.780
de la secundaria
y sólo tienes que

00:09:41.780 --> 00:09:44.015
especificar el puerto aquí en este caso.

00:09:44.015 --> 00:09:47.900
>> Correcto. Así que haces un alto
disponibilidad y como parte de eso,

00:09:47.900 --> 00:09:49.980
también se podría hacer el
sólo lectura, [inaudible]

00:09:49.980 --> 00:09:51.365
>> Exactamente. Sí.

00:09:51.365 --> 00:09:54.290
>> Genial. ¿Es así como lees esto?
como una línea [inaudible]?

00:09:54.290 --> 00:09:57.470
>> Sí. Sólo tiene sespecificar
cuántas réplicas

00:09:57.470 --> 00:10:02.480
no te preocupes por orquestar,

00:10:02.480 --> 00:10:05.900
desplegando
componentes como cuando se dice

00:10:05.900 --> 00:10:09.545
nosotros que quiero tres réplicas
para SQL Server maestro,

00:10:09.545 --> 00:10:10.820
desplegamos al operador,

00:10:10.820 --> 00:10:12.260
desplegamos el supervisor que es

00:10:12.260 --> 00:10:14.030
haciendo el monitoreo
y todo lo demás.

00:10:14.030 --> 00:10:17.180
Así que todo está detrás
las escenas y que

00:10:17.180 --> 00:10:21.380
es una orquestación mínima
para configurar las cosas.

00:10:21.380 --> 00:10:23.840
Para la gente que es
muy familiarizado con cómo

00:10:23.840 --> 00:10:27.905
para configurar una disponibilidad
grupos creo que es

00:10:27.905 --> 00:10:32.090
al menos cuatro o cinco
Instrucciones T-SQL

00:10:32.090 --> 00:10:34.970
además de puntos finales de preparación
y cosas así.

00:10:34.970 --> 00:10:37.355
Así que eso es espinoso preguntado.

00:10:37.355 --> 00:10:39.830
Está llevando esa carga de YouTube a

00:10:39.830 --> 00:10:42.415
centrarse en correr realmente
lo que está en el big data.

00:10:42.415 --> 00:10:44.940
>> Correcto. No se obtiene más
simple que esto, ¿verdad?

00:10:44.940 --> 00:10:45.420
>> Lo es.

00:10:45.420 --> 00:10:48.350
>> Una línea y, por supuesto, si
la instancia maestra si desea

00:10:48.350 --> 00:10:52.430
más líneas para sólo lectura, pero
Sí, eso es realmente impresionante.

00:10:52.430 --> 00:10:54.740
Fresco. Entonces, ¿dónde puedo
encontrar más sobre esto?

00:10:54.740 --> 00:10:56.385
¿Cómo puedo empezar?

00:10:56.385 --> 00:11:00.920
>> Así que definitivamente te mostraré

00:11:00.920 --> 00:11:03.915
exactamente algunos enlaces
que usted puede aprovechar

00:11:03.915 --> 00:11:07.140
para el despliegue,
para la configuración.

00:11:07.140 --> 00:11:11.749
Así que usted puede encontrar escuchar más acerca de
en nuestra plataforma de documentación

00:11:11.749 --> 00:11:14.000
pero también tenemos mucho
de muestras por ahí

00:11:14.000 --> 00:11:16.460
sobre cómo configurar las cosas.

00:11:16.460 --> 00:11:18.500
Cómo ejecutar cargas de trabajo,

00:11:18.500 --> 00:11:21.380
y todo lo que
puede seguir adelante para usar

00:11:21.380 --> 00:11:24.350
estos enlaces y aprovecharlos para
¿qué hacer lo que quieras hacer.

00:11:24.350 --> 00:11:25.490
Serán nuestros grupos.

00:11:25.490 --> 00:11:28.550
>> Genial. Bueno, gracias de nuevo por
compartir y hablar a través de esto.

00:11:28.550 --> 00:11:30.260
Esto es muy impresionante.

00:11:30.260 --> 00:11:32.555
Me gusta la facilidad de crear esto.

00:11:32.555 --> 00:11:32.760
>> Sí.

00:11:32.760 --> 00:11:34.700
>> Esto es claramente mucho trabajo.

00:11:34.700 --> 00:11:36.695
>> Bastante impresionante. Sí. Gracias.

00:11:36.695 --> 00:11:39.410
>> Bueno, gracias. Gracias
para mirar.

00:11:39.410 --> 00:11:41.525
Por favor, como, suscribirse,
dejar un comentario,

00:11:41.525 --> 00:11:43.830
y espero verte
la próxima vez. Gracias.

00:11:43.830 --> 00:11:55.690
[MUSICA]

