WEBVTT

00:00:00.000 --> 00:00:02.745
Кластеры больших данных обеспечивают

00:00:02.745 --> 00:00:05.640
способ сохранения кластера
надежный путем включения

00:00:05.640 --> 00:00:08.460
высокая доступность для критических
компоненты и Михаэла

00:00:08.460 --> 00:00:12.120
здесь, чтобы рассказать нам все о
оно сегодня на данных подвергшся действию.

00:00:12.120 --> 00:00:23.400
(МУЗЫКА)

00:00:23.400 --> 00:00:26.475
Привет, и добро пожаловать в другой
эпизод данных разоблачены.

00:00:26.475 --> 00:00:30.480
Я ваш хозяин Джероен и сегодня
у нас есть Михаэла с нами, чтобы поговорить

00:00:30.480 --> 00:00:32.265
о кластерах больших данных, а затем

00:00:32.265 --> 00:00:34.970
в частности, высокий
доступности для них.

00:00:34.970 --> 00:00:37.655
Так что добро пожаловать обратно. Это должно
быть в четвертый раз я думаю.

00:00:37.655 --> 00:00:39.560
Да, да. Спасибо. Благодарю
Вы за то, что я здесь.

00:00:39.560 --> 00:00:40.985
Да, да. Ты становишься зондом.

00:00:40.985 --> 00:00:43.550
Таким образом, большинство тем, которые вы говорите

00:00:43.550 --> 00:00:46.445
о кластерах больших данных
и сегодня ничем не отличается.

00:00:46.445 --> 00:00:48.345
Но тогда высокая доступность, не так ли?

00:00:48.345 --> 00:00:50.780
Да, да. Таким образом, есть
много вещей, чтобы

00:00:50.780 --> 00:00:53.360
говорить о том, когда речь идет
к высокой доступности.

00:00:53.360 --> 00:00:54.155
Хорошо, хорошо.

00:00:54.155 --> 00:00:57.590
Мы собираемся пройти через некоторые
из этих аспектов в этом видео.

00:00:57.590 --> 00:00:59.785
Хорошо, хорошо. Классно. Теперь давайте начнем.

00:00:59.785 --> 00:01:05.745
Поэтому, когда мы говорим о данных
особенно и баз данных,

00:01:05.745 --> 00:01:07.800
мы хотим убедиться, что
данные – это настойчивость.

00:01:07.800 --> 00:01:09.110
Так что я просто хочу начать с

00:01:09.110 --> 00:01:13.430
это высокая доступность говорить
с наивным резюме.

00:01:13.430 --> 00:01:13.650
Хорошо, хорошо.

00:01:13.650 --> 00:01:14.850
Так что различные слои в

00:01:14.850 --> 00:01:17.840
кластер больших данных имеет
различные варианты хранения.

00:01:17.840 --> 00:01:20.180
Либо вы можете сделать локальное хранилище или

00:01:20.180 --> 00:01:23.150
удаленный, и мы сделали это как гранулированный, как

00:01:23.150 --> 00:01:25.970
Вы можете выбрать для местных или удаленных

00:01:25.970 --> 00:01:28.895
в зависимости от того, если вы хотите
хранить данные или журналы.

00:01:28.895 --> 00:01:33.680
Так журналы вы не хотите
обязательно, чтобы сделать его излишним

00:01:33.680 --> 00:01:36.865
потому что вы, возможно, потребуется для

00:01:36.865 --> 00:01:40.930
устранение неполадок, но тогда вы
не хочу, чтобы держать их навсегда.

00:01:41.090 --> 00:01:42.190
(неразборчиво).

00:01:42.190 --> 00:01:44.840
Точно. Так что, когда
мы говорим о журналах

00:01:44.840 --> 00:01:48.140
в основном вы хотите сохранить
их на местном хранении

00:01:48.140 --> 00:01:52.355
особенно потому, что мы говорили
в последнем видео, которое у нас есть

00:01:52.355 --> 00:01:54.590
компоненты в кластерах, которые

00:01:54.590 --> 00:01:57.410
сбор этих журналов и
начиная их в упругий поиск.

00:01:57.410 --> 00:02:01.615
Таким образом, у вас уже есть некоторые
зависимость от этого аспекта.

00:02:01.615 --> 00:02:04.410
Когда дело доходит до данных,
различные компоненты

00:02:04.410 --> 00:02:08.270
имеют различные требования
в зависимости от того, как

00:02:08.270 --> 00:02:10.730
миссия критическая, и если есть

00:02:10.730 --> 00:02:15.140
любые пользовательские данные, которые хранятся
для данных, например,

00:02:15.140 --> 00:02:20.030
Мастер или хранилище серверов S'L
пул, как данные HDFS хранится.

00:02:20.030 --> 00:02:22.955
Вы хотите сохранить
избыточности для этого.

00:02:22.955 --> 00:02:28.445
Но вычислительный бассейн или Spark,

00:02:28.445 --> 00:02:30.695
нет государства.

00:02:30.695 --> 00:02:33.380
Это просто вычисления.
Так что нет смысла

00:02:33.380 --> 00:02:36.560
добавить дополнительные
избыточности для хранения.

00:02:36.560 --> 00:02:38.225
Точно. Таким образом, вы можете выбрать местные.

00:02:38.225 --> 00:02:39.470
Так что мы говорим здесь о

00:02:39.470 --> 00:02:42.260
различные варианты, которые
Вы должны обеспечить

00:02:42.260 --> 00:02:44.810
надежность этих услуг

00:02:44.810 --> 00:02:46.400
когда дело доходит до сохранения данных.

00:02:46.400 --> 00:02:47.620
Хорошо, хорошо.

00:02:47.620 --> 00:02:51.575
Вот где мы продолжаем
с вариантами HA, не так ли?

00:02:51.575 --> 00:02:55.985
Так что для мастера сервера S'L, если ваш
история в ваших данных локально,

00:02:55.985 --> 00:02:57.725
вы должны убедиться, что вы добавляете

00:02:57.725 --> 00:02:59.675
некоторые дополнительные избыточности, что

00:02:59.675 --> 00:03:01.340
с группами доступности
и мы собираемся

00:03:01.340 --> 00:03:04.160
увидеть в ближайшее время, как это включено.

00:03:04.160 --> 00:03:05.990
Когда дело доходит до пула данных,

00:03:05.990 --> 00:03:13.970
Вы используете. в комбинаторах, чтобы
обеспечить наличие данных.

00:03:13.970 --> 00:03:15.350
Так что это просто пр.

00:03:15.350 --> 00:03:16.505
Здесь много аббревиатур.

00:03:16.505 --> 00:03:17.240
Да, да.

00:03:17.240 --> 00:03:21.110
Например, П.В., HA, все. есть?

00:03:21.110 --> 00:03:25.175
Предлагает PVs это
Концепция Кубернете

00:03:25.175 --> 00:03:28.250
что абстрагирует слой хранения

00:03:28.250 --> 00:03:32.090
Kubernetes и гарантирует, если вы
с использованием постоянных объемов.

00:03:32.090 --> 00:03:35.270
Таким образом, понятие является сохранение данных.

00:03:35.270 --> 00:03:37.010
Так что если вы используете
стойкий объем это

00:03:37.010 --> 00:03:38.840
означает, что Kubernetes гарантирует, что

00:03:38.840 --> 00:03:42.440
данные сохраняются на этом хранилище.

00:03:42.440 --> 00:03:43.580
Хорошо, хорошо. Есть.

00:03:43.580 --> 00:03:46.655
Опять же, нет необходимости

00:03:46.655 --> 00:03:49.435
высокая доступность для вычислений
потому что это апота.

00:03:49.435 --> 00:03:52.110
Он имеет критические компоненты

00:03:52.110 --> 00:03:53.870
в стеке Хадуп
право, когда дело доходит до

00:03:53.870 --> 00:03:56.600
HDFS NameNode и некоторые Spark поделился

00:03:56.600 --> 00:04:00.545
услуг, которые вам нужны
обеспечить высокую доступность для,

00:04:00.545 --> 00:04:03.020
и очень важно, я
хочу выделить здесь

00:04:03.020 --> 00:04:09.000
Контрольной службы, что вы должны
имеют не только постоянный объем,

00:04:09.000 --> 00:04:11.490
Вам нужно добавить некоторые
избыточности к этой истории.

00:04:11.490 --> 00:04:14.135
Так что это должно быть несколько
удаленное избыточное хранилище.

00:04:14.135 --> 00:04:16.940
Не держите свой контроль (неразборчиво)

00:04:16.940 --> 00:04:21.410
локально, потому что если это
узла здесь последний,

00:04:21.410 --> 00:04:23.960
почти весь кластер
не в очень ограниченном.

00:04:23.960 --> 00:04:28.130
Хорошо, хорошо. Так контроль есть
. на удаленном хранилище?

00:04:28.130 --> 00:04:29.270
Удаленный и избыточный.

00:04:29.270 --> 00:04:31.100
Таким образом, вы должны сделать
уверен, что они добавляют

00:04:31.100 --> 00:04:33.005
некоторые избыточности этого слоя.

00:04:33.005 --> 00:04:34.710
Хорошо, хорошо. Отметил.

00:04:34.710 --> 00:04:37.290
Так что теперь давайте посмотрим,
что это означает для

00:04:37.290 --> 00:04:41.085
Мастер сервера и
позволяет AG для этого.

00:04:41.085 --> 00:04:45.095
Так что это схема или

00:04:45.095 --> 00:04:50.045
как расположение различных услуг
которые образуют сервер S'L,

00:04:50.045 --> 00:04:55.190
высокий уровень доступности
для мастера сервера S'L.

00:04:55.190 --> 00:04:57.020
Опять же, у нас есть первичный, который

00:04:57.020 --> 00:05:00.785
является по крайней мере два второстепенных
право синхронно,

00:05:00.785 --> 00:05:04.670
и мы построили компоненты, которые

00:05:04.670 --> 00:05:08.985
гарантируют, что
является автоматическим мониторингом,

00:05:08.985 --> 00:05:11.370
автоматическое сбой
и оркестровки.

00:05:11.370 --> 00:05:12.960
Если что-то случится с первичной,

00:05:12.960 --> 00:05:17.675
это происходит автоматически, есть
нет необходимости ничего делать.

00:05:17.675 --> 00:05:20.330
Одна вещь, которую я хочу
чтобы выделить здесь

00:05:20.330 --> 00:05:23.870
что для кластера больших данных
только в это время,

00:05:23.870 --> 00:05:27.755
мы также включаем то, что мы называем
Группа содержащихся в наличии,

00:05:27.755 --> 00:05:30.920
это означает, что теперь объекты, которые

00:05:30.920 --> 00:05:33.920
Вы храните в мастер, например, как

00:05:33.920 --> 00:05:40.190
Логины также реплицируются
на второстепенных, не так ли?

00:05:40.190 --> 00:05:40.380
Хорошо, хорошо.

00:05:40.380 --> 00:05:43.880
Так что до сих пор это
вместе посылают нас от

00:05:43.880 --> 00:05:45.770
наших клиентов, чтобы сделать
уверен, что логины

00:05:45.770 --> 00:05:47.930
также реплицируются в противном случае,

00:05:47.930 --> 00:05:49.610
Есть много обвинений и

00:05:49.610 --> 00:05:51.935
ручной репликации они должны были сделать.

00:05:51.935 --> 00:05:55.290
Прямо сейчас автоматически
обо всем заботятся.

00:05:55.290 --> 00:05:57.060
Таким образом, от развертывания, от добавления

00:05:57.060 --> 00:05:59.130
баз данных для групп доступности,

00:05:59.130 --> 00:06:05.330
к добавлению этого мастера реплицируется
группы доступности баз данных.

00:06:05.330 --> 00:06:08.555
Так что мало, если нет

00:06:08.555 --> 00:06:13.130
оперативное управление

00:06:13.130 --> 00:06:16.620
группы доступности.
Это очень круто.

00:06:16.620 --> 00:06:18.660
Да, да. Это действительно
Замечательно. Я хотела сказать.

00:06:18.660 --> 00:06:21.230
Итак, но вы упомянули
групп ы доступности сейчас, не так ли?

00:06:21.230 --> 00:06:21.390
Да, да.

00:06:21.390 --> 00:06:24.330
Вопрос: Является ли это регулярным?

00:06:24.330 --> 00:06:27.200
Да, да. Это именно
та же функция, что мы

00:06:27.200 --> 00:06:30.050
все знают из S'L Server 2012, не так ли?

00:06:30.050 --> 00:06:30.605
Да, да.

00:06:30.605 --> 00:06:33.440
Одна вещь, которая
это очень важно.

00:06:33.440 --> 00:06:35.960
Других кластерных технологий нет

00:06:35.960 --> 00:06:39.365
что вам придется иметь, чтобы
развернуть или интегрировать с.

00:06:39.365 --> 00:06:41.445
Его все позаботились о,

00:06:41.445 --> 00:06:44.590
службы, которые развертывают
с руководителем HA,

00:06:44.590 --> 00:06:45.730
оператора и

00:06:45.730 --> 00:06:49.840
курс тесно интегрируется с
Kubernetes в письменном виде этого дела.

00:06:49.840 --> 00:06:52.560
Таким образом, мы пользуемся
этих платформ.

00:06:52.560 --> 00:06:54.100
Так что больше никаких кластерных технологий.

00:06:54.100 --> 00:06:56.650
Так что это отлично подходит для освоения.

00:06:56.650 --> 00:07:00.510
Так что теперь я доверяю мастеру
экземпляры в порядке.

00:07:00.510 --> 00:07:02.250
Но это еще не BDC, не так ли?

00:07:02.250 --> 00:07:03.965
Мы делаем не только сервер S'L,

00:07:03.965 --> 00:07:05.980
мы делаем «неразборчиво»
связанные вещи.

00:07:05.980 --> 00:07:07.510
Так скажите мне.

00:07:07.510 --> 00:07:10.230
Итак, давайте посмотрим на то, что мы
делать для Hadoop, для HDFS.

00:07:10.230 --> 00:07:13.690
Так HDFS NameNode также должны быть в

00:07:13.690 --> 00:07:16.540
высокодоступная конфигурация
потому что это очень важно

00:07:16.540 --> 00:07:20.035
для стека Хадупа,

00:07:20.035 --> 00:07:23.205
и то, что мы видим, что
клиент говорит нам: 'О,

00:07:23.205 --> 00:07:26.395
Я хочу репликации для NameNode',

00:07:26.395 --> 00:07:28.640
будет также развертывание зоохранителя, который

00:07:28.640 --> 00:07:31.430
представляет собой кластерную технологию с открытым исходным кодом.

00:07:31.430 --> 00:07:35.750
Это компонент, который собирается
заботиться о координации

00:07:35.750 --> 00:07:39.800
мониторинга и сбоя, если

00:07:39.800 --> 00:07:44.970
необходимо NameNode
в резервный вторичный.

00:07:44.970 --> 00:07:45.070
Хорошо, хорошо.

00:07:45.070 --> 00:07:47.330
Развертывание дополнительной реплики

00:07:47.330 --> 00:07:49.985
и зоозащитник заботится
аспекта оркестровки.

00:07:49.985 --> 00:07:50.675
Хорошо, хорошо.

00:07:50.675 --> 00:07:55.235
В одно и то же время
он также участвует в

00:07:55.235 --> 00:07:58.580
поддержание высокой доступности для

00:07:58.580 --> 00:08:03.679
некоторые компоненты Spark доля
как менеджер ресурсов Yarn,

00:08:03.679 --> 00:08:07.520
и в этом смысле для
Искра мы также развернуть

00:08:07.520 --> 00:08:12.200
несколько реплик для служб
как история Spark, История работы.

00:08:12.200 --> 00:08:15.515
Таким образом, чтобы убедиться, что если что-то

00:08:15.515 --> 00:08:19.900
происходит в OneNote, что
эти услуги размещаются,

00:08:19.900 --> 00:08:23.495
«Неразборчиво» будет выбрано
вверх или дополнительные реплики.

00:08:23.495 --> 00:08:24.790
Прохладный.

00:08:24.790 --> 00:08:28.490
Итак, давайте посмотрим, как легко

00:08:28.490 --> 00:08:32.570
настроить высокую доступность
для различных компонентов.

00:08:32.570 --> 00:08:33.530
Скажи мне, что это просто.

00:08:33.530 --> 00:08:35.510
Это супер легко.

00:08:35.510 --> 00:08:38.280
Прохладный. Мне нравится легко.

00:08:38.470 --> 00:08:42.740
В последний раз мы говорили о том, как
настройка развертываний.

00:08:42.740 --> 00:08:43.820
Да, да. Я помню это.

00:08:43.820 --> 00:08:47.270
Есть кластер
конфигурации файлов

00:08:47.270 --> 00:08:49.675
или шаблоны развертывания
что у вас есть,

00:08:49.675 --> 00:08:52.280
и помните, что мы
говорить ранее о

00:08:52.280 --> 00:08:55.700
компоненты общего участия Spark.

00:08:55.700 --> 00:08:56.210
Да, да.

00:08:56.210 --> 00:08:59.975
Я просто говорю, что я просто хочу два
копии из них и все.

00:08:59.975 --> 00:09:02.060
Мы заботимся о
поднимая оттуда.

00:09:02.060 --> 00:09:03.020
Вопрос: Это все?

00:09:03.020 --> 00:09:04.610
- Зоозащитник. Итак, еще раз,

00:09:04.610 --> 00:09:08.450
мы должны пройти через все
компоненты, которые мы прошли.

00:09:08.450 --> 00:09:12.980
Зоозащитник, который нам понадобится
три реплики для обеспечения кворума.

00:09:12.980 --> 00:09:16.145
Тогда мы также упомянули мастера,

00:09:16.145 --> 00:09:19.465
Мастер-экземпляр сервера S'L
и что мне здесь делать?

00:09:19.465 --> 00:09:22.755
Я бы просто сказал, что я
хотите три реплики,

00:09:22.755 --> 00:09:26.930
и потому, что сервер S'L
группы доступности

00:09:26.930 --> 00:09:28.985
также позволяет читаемые второстепенные,

00:09:28.985 --> 00:09:31.640
даст вам возможность

00:09:31.640 --> 00:09:36.440
развертывание службы, которая
обнажает конечную точку

00:09:36.440 --> 00:09:39.920
чтобы дежурить удаленно рабочей нагрузки

00:09:39.920 --> 00:09:41.780
из вторичного
и вы просто должны

00:09:41.780 --> 00:09:44.015
указать порт здесь в этом случае.

00:09:44.015 --> 00:09:47.900
В-право. Таким образом, вы делаете высокий
доступности и в рамках этого,

00:09:47.900 --> 00:09:49.980
Вы могли бы также сделать
читать только, «неразборчиво»

00:09:49.980 --> 00:09:51.365
Точно. Да.

00:09:51.365 --> 00:09:54.290
Прохладный. Это, как вы читаете это
так же, как одна строка (неразборчиво) ?

00:09:54.290 --> 00:09:57.470
Да, да. Вы просто указать
сколько реплик вы

00:09:57.470 --> 00:10:02.480
не беспокойтесь о оркестровке,

00:10:02.480 --> 00:10:05.900
развертывание дополнительных
компоненты, как, когда вы говорите

00:10:05.900 --> 00:10:09.545
нам, что я хочу три реплики
для мастера сервера S'L,

00:10:09.545 --> 00:10:10.820
мы развертываем оператора,

00:10:10.820 --> 00:10:12.260
мы развернули руководитель, который

00:10:12.260 --> 00:10:14.030
делать мониторинг
и все остальное.

00:10:14.030 --> 00:10:17.180
Так что все позади
сцены и что

00:10:17.180 --> 00:10:21.380
является минимальной оркестровки
для настройки вещей.

00:10:21.380 --> 00:10:23.840
Для людей, которые
очень хорошо знакомы с тем, как

00:10:23.840 --> 00:10:27.905
настройка доступности
группы, я думаю, что это

00:10:27.905 --> 00:10:32.090
по крайней мере четыре или пять
Заявления о Т-СЗЛ

00:10:32.090 --> 00:10:34.970
плюс предепливовые конечные точки
и тому подобное.

00:10:34.970 --> 00:10:37.355
Так вот колючий спросил.

00:10:37.355 --> 00:10:39.830
Он принимает, что нагрузка с YouTube на

00:10:39.830 --> 00:10:42.415
сосредоточиться на фактической работает
что на больших данных.

00:10:42.415 --> 00:10:44.940
В-право. Он не получает больше
просто, чем это, не так ли?

00:10:44.940 --> 00:10:45.420
В-это.

00:10:45.420 --> 00:10:48.350
Одна строка, а затем, конечно, если
мастер экземпляр, если вы хотите

00:10:48.350 --> 00:10:52.430
больше строк для чтения только, но
Да, это действительно впечатляет.

00:10:52.430 --> 00:10:54.740
Классно. Так где я могу
найти больше об этом?

00:10:54.740 --> 00:10:56.385
Как начать?

00:10:56.385 --> 00:11:00.920
Так что определенно я покажу вам

00:11:00.920 --> 00:11:03.915
именно некоторые ссылки
что вы можете использовать

00:11:03.915 --> 00:11:07.140
для развертывания,
для конфигурации.

00:11:07.140 --> 00:11:11.749
Таким образом, вы можете найти услышать больше о
это в нашей платформе документации

00:11:11.749 --> 00:11:14.000
но у нас также есть много
образцов там

00:11:14.000 --> 00:11:16.460
о том, как настроить вещи.

00:11:16.460 --> 00:11:18.500
Как запустить рабочие нагрузки,

00:11:18.500 --> 00:11:21.380
и все, что вы
может идти вперед, чтобы использовать

00:11:21.380 --> 00:11:24.350
это связывает и использовать их для
что делать, что вы хотите сделать.

00:11:24.350 --> 00:11:25.490
Ты будешь нашими кластерами.

00:11:25.490 --> 00:11:28.550
Прохладный. Ну, еще раз спасибо за
обмен и говорить, хотя это.

00:11:28.550 --> 00:11:30.260
Это очень впечатляет.

00:11:30.260 --> 00:11:32.555
Мне нравится легкость создания этого.

00:11:32.555 --> 00:11:32.760
Да, да.

00:11:32.760 --> 00:11:34.700
Безусловно, это большая работа.

00:11:34.700 --> 00:11:36.695
Довольно потрясающе. Да. Спасибо.

00:11:36.695 --> 00:11:39.410
Ну, спасибо. Благодарю
Вы для просмотра.

00:11:39.410 --> 00:11:41.525
Пожалуйста, подпишитесь,
оставить комментарий,

00:11:41.525 --> 00:11:43.830
и надеемся увидеть вас
в следующий раз. Спасибо.

00:11:43.830 --> 00:11:55.690
(МУЗЫКА)

