WEBVTT

00:00:00.000 --> 00:00:03.070
Сервер S'L 2019 большой
кластеры данных обеспечивают

00:00:03.070 --> 00:00:04.950
Пулы данных для оптимизации

00:00:04.950 --> 00:00:07.905
производительность запроса при достижении
из нескольких источников.

00:00:07.905 --> 00:00:10.080
Умачандар здесь с
нам сегодня, чтобы рассказать нам все

00:00:10.080 --> 00:00:12.450
об этом сегодня на данные разоблачены.

00:00:12.450 --> 00:00:23.550
(Музыка).

00:00:23.550 --> 00:00:26.250
Привет и добро пожаловать в другой
эпизод данных разоблачены.

00:00:26.250 --> 00:00:29.100
Я ваш хозяин Джероен и
сегодня у нас есть вы видите нас

00:00:29.100 --> 00:00:32.085
говорить о пулах данных
в кластерах больших данных S'L.

00:00:32.085 --> 00:00:33.675
Привет Umachandar добро пожаловать на шоу.

00:00:33.675 --> 00:00:35.460
Привет, я счастлив быть здесь.

00:00:35.460 --> 00:00:38.160
Таким образом, пулы данных в
кластеров больших данных.

00:00:38.160 --> 00:00:40.505
Что это такое? Что мне нужно знать?

00:00:40.505 --> 00:00:42.440
Конечно, да, позвольте мне быстро начать

00:00:42.440 --> 00:00:45.110
показывая, что
Кластер больших данных.

00:00:45.110 --> 00:00:48.090
Итак, этот слайд показывает развертывание

00:00:48.090 --> 00:00:52.110
Большие данные сервера 19
Кластер и сегодня мы

00:00:52.110 --> 00:00:56.360
будет говорить о данных
Бассейны здесь, которые в основном

00:00:56.360 --> 00:00:59.300
два экземпляра сервера S'L, которые могут быть

00:00:59.300 --> 00:01:02.960
используется для разгрузки некоторых
запроса «неразборчиво».

00:01:02.960 --> 00:01:04.810
Итак, давайте посмотрим, что такое пул данных.

00:01:04.810 --> 00:01:08.390
Так что это в основном сервер S'L
хранения и вычисления, которые

00:01:08.390 --> 00:01:13.550
при условии написания запросов
и хранить данные в пуле данных.

00:01:13.550 --> 00:01:16.310
Он может манипулировать, запустив

00:01:16.310 --> 00:01:20.900
некоторые внешние операции таблицы
на нем, и вы заселяют данные

00:01:20.900 --> 00:01:24.440
в пул данных и
позже вы можете на самом деле

00:01:24.440 --> 00:01:28.970
разгрузить некоторые из ваших аналитических
запросы к этому пулу данных.

00:01:28.970 --> 00:01:32.400
Так что это основной
цель пула данных.

00:01:32.400 --> 00:01:37.140
Так что теперь давайте можем быть быстро принять
взглянуть на некоторые из сценариев.

00:01:37.140 --> 00:01:39.980
Таким образом, общий сценарий, вы

00:01:39.980 --> 00:01:42.710
получение данных из
различных источников данных,

00:01:42.710 --> 00:01:44.570
некоторые из них быстро,

00:01:44.570 --> 00:01:47.345
другие медленнее по своей природе.

00:01:47.345 --> 00:01:51.050
Так что теперь вы хотите в основном оптимизировать

00:01:51.050 --> 00:01:55.535
этот запрос, чтобы вы могли
на самом деле принять этот запрос

00:01:55.535 --> 00:02:00.350
и хранить результаты в
Пул данных, и это позволяет

00:02:00.350 --> 00:02:02.900
в основном использовать, что, как

00:02:02.900 --> 00:02:07.300
промежуточной области, где вы
может работать все ваши аналитики.

00:02:07.300 --> 00:02:10.830
Другой пример, если вы
делает машинное обучение,

00:02:10.830 --> 00:02:12.830
Есть много
сценарии, где вы

00:02:12.830 --> 00:02:14.960
будет генерировать функции
и сотни и

00:02:14.960 --> 00:02:18.290
тысячи функций и
Вы хотите в основном хранить

00:02:18.290 --> 00:02:23.040
набор данных в месте, где
вы можете сделать повторный анализ.

00:02:23.040 --> 00:02:26.145
Это еще одно место, где
пул данных помогает.

00:02:26.145 --> 00:02:29.540
Так что в этом случае это не
только для оптимизации запросов

00:02:29.540 --> 00:02:31.190
но и для того, чтобы убедиться,
Вы не должны идти

00:02:31.190 --> 00:02:32.975
вернуться к источнику данных
все время, не так ли?

00:02:32.975 --> 00:02:33.230
Да, да.

00:02:33.230 --> 00:02:34.385
Если вы хотите повторно использовать данные.

00:02:34.385 --> 00:02:34.625
Да, да.

00:02:34.625 --> 00:02:35.660
Здорово, это звучит очень круто.

00:02:35.660 --> 00:02:37.355
Так что вы можете на самом деле
показать нам, как это работает?

00:02:37.355 --> 00:02:40.550
Да, давайте быстро уйдем
оценить, сколько здесь.

00:02:40.550 --> 00:02:42.230
Так что у меня есть здесь, это

00:02:42.230 --> 00:02:45.530
подключение к СЗЛ
Кластер больших данных сервера.

00:02:45.530 --> 00:02:48.890
Я подключен к S'L
Экземпляр мастера сервера.

00:02:48.890 --> 00:02:51.905
Таким образом, способ создания пула данных

00:02:51.905 --> 00:02:55.625
является первым путем создания
этот объект источника данных.

00:02:55.625 --> 00:02:58.100
Так вот, как это имя указывает

00:02:58.100 --> 00:03:01.325
здесь это в основном говорит, что
тип источника данных это.

00:03:01.325 --> 00:03:04.400
Тогда это я собираюсь
подключение к пулу данных.

00:03:04.400 --> 00:03:05.530
Хорошо, хорошо.

00:03:05.530 --> 00:03:08.780
Вот как вы
создать его. После этого

00:03:08.780 --> 00:03:11.360
Вы определяете таблицу
которые вы хотите

00:03:11.360 --> 00:03:13.940
хранить в данных
Бассейн и это сделано

00:03:13.940 --> 00:03:16.670
запустив эту внешнюю
выписка таблицы.

00:03:16.670 --> 00:03:17.845
Хорошо, хорошо.

00:03:17.845 --> 00:03:21.090
Это выглядит как ваш обычный
создать выписку таблицы,

00:03:21.090 --> 00:03:24.110
Есть столбцы, которые
Вы должны определить и в

00:03:24.110 --> 00:03:27.725
кроме того, поскольку есть много S'L
экземпляры сервера на бэкэнде.

00:03:27.725 --> 00:03:28.115
В-право.

00:03:28.115 --> 00:03:30.740
Вы просто должны сказать, как вы
хотите распространять данные.

00:03:30.740 --> 00:03:32.630
Так что с этим вы можете сказать, хорошо,

00:03:32.630 --> 00:03:36.155
так что мы получили даже или примерно
даже распределение поперек.

00:03:36.155 --> 00:03:36.515
Да, да.

00:03:36.515 --> 00:03:37.400
Через службу.

00:03:37.400 --> 00:03:37.685
Да, да.

00:03:37.685 --> 00:03:38.000
Хорошо, хорошо.

00:03:38.000 --> 00:03:41.330
Так вот что круглый малиновка
делает в основном распространять

00:03:41.330 --> 00:03:44.825
данные по
Экземпляры пула данных у вас есть.

00:03:44.825 --> 00:03:45.865
Хорошо, хорошо.

00:03:45.865 --> 00:03:49.370
Следующее, что вы можете
сделать, как запрос данных.

00:03:49.370 --> 00:03:50.780
Итак, давайте сначала взглянем на некоторые из

00:03:50.780 --> 00:03:54.155
выборочные данные, которые в
этот пример у меня есть в

00:03:54.155 --> 00:03:57.680
КАТАЛОГ HDFS и в основном

00:03:57.680 --> 00:04:00.155
Я хочу взять эти
данные по ссылкам,

00:04:00.155 --> 00:04:04.490
сделать некоторые запросы и заполнить
в пул данных.

00:04:04.490 --> 00:04:08.915
То, как вы сделали бы это,
работает только вставка оператора.

00:04:08.915 --> 00:04:13.490
Таким образом, источник вставки
заявление — это всего лишь запрос S'L,

00:04:13.490 --> 00:04:18.140
и вы можете просто запустить
запрос и замыкать данные.

00:04:18.140 --> 00:04:21.320
Я не буду бегать по
вставки, но давайте быстро

00:04:21.320 --> 00:04:25.205
видеть данные, которые уже
населенных в пуле данных.

00:04:25.205 --> 00:04:28.445
Таким образом, этот запрос должен вернуться
около 2000 рядов, не так ли?

00:04:28.445 --> 00:04:32.930
Так что теперь, как и любой другой
таблица, к ней можно присоединиться

00:04:32.930 --> 00:04:37.460
эта таблица с другими таблицами
в вашем сервере S'L и получить

00:04:37.460 --> 00:04:39.680
результаты и прозрачно

00:04:39.680 --> 00:04:42.200
этот экземпляр сервера S'L
собирается поговорить с

00:04:42.200 --> 00:04:47.555
экземпляры пула данных для запуска
запросы и получить результаты.

00:04:47.555 --> 00:04:50.330
Так что это на высоком уровне
о том, что такое пул данных.

00:04:50.330 --> 00:04:51.530
Прохладный Awesome.

00:04:51.530 --> 00:04:54.390
Это очень впечатляет.
Большое спасибо человеку.

00:04:54.390 --> 00:04:55.530
Прохладный да, спасибо.

00:04:55.530 --> 00:04:58.050
Хорошо, хорошо. Так что спасибо за просмотр.

00:04:58.050 --> 00:04:59.590
Пожалуйста, нравится и подписаться,

00:04:59.590 --> 00:05:02.150
комментарий к видео
если вы хотите, чтобы мы

00:05:02.150 --> 00:05:06.360
запись что-то другое и надежды
видеться с тобой в следующий раз. Спасибо.

00:05:06.360 --> 00:05:20.860
(МУЗЫКА)

