WEBVTT

00:00:00.000 --> 00:00:03.000
Сервер S'L 2019 Большой
Кластеры данных обеспечивают

00:00:03.000 --> 00:00:06.585
вычислять пулы для разгрузки
распределенная обработка запросов.

00:00:06.585 --> 00:00:10.350
UC здесь, чтобы рассказать нам все о
это сегодня на данных exposed.

00:00:10.350 --> 00:00:21.060
(МУЗЫКА)

00:00:21.060 --> 00:00:25.215
Привет. Добро пожаловать в другой эпизод
данных разоблачены. Я Джерун.

00:00:25.215 --> 00:00:27.810
Сегодня ко мне присоединился UC
говорить о вычислениях

00:00:27.810 --> 00:00:30.690
пулы в сервере S'L
Кластеры больших данных 2019 года.

00:00:30.690 --> 00:00:33.000
Привет, UC. Спасибо за
присоединиться к шоу снова.

00:00:33.000 --> 00:00:34.155
Конечно же.

00:00:34.155 --> 00:00:36.060
- Вычислительные пулы?

00:00:36.060 --> 00:00:36.615
Да, да.

00:00:36.615 --> 00:00:37.815
Что это такое?

00:00:37.815 --> 00:00:40.980
- Вычислительные пулы. Они

00:00:40.980 --> 00:00:44.430
в основном экземпляры сервера S'L
в кластере больших данных,

00:00:44.430 --> 00:00:48.725
которые могут быть использованы для разгрузки
распределенная обработка запросов.

00:00:48.725 --> 00:00:50.310
Итак, на этой картинке,

00:00:50.310 --> 00:00:54.870
мы видим много компонентов в
кластер больших данных сервера S'L.

00:00:54.870 --> 00:00:58.570
Сегодня мы будем смотреть на
этот вычислительный пул здесь.

00:00:58.570 --> 00:01:01.710
Так что же это такое? Это
в основном набор

00:01:01.710 --> 00:01:03.825
Экземпляры сервера S'L, которые

00:01:03.825 --> 00:01:06.685
автоматически брошут
внутри кластера больших данных,

00:01:06.685 --> 00:01:10.475
и они доступны для
выполнения распределенных запросов.

00:01:10.475 --> 00:01:11.405
Хорошо, хорошо.

00:01:11.405 --> 00:01:14.030
Это похоже на PolyBase

00:01:14.030 --> 00:01:17.585
Масштабные группы в сервере S'L Server 2016.

00:01:17.585 --> 00:01:21.490
Эта возможность теперь предоставляет вам

00:01:21.490 --> 00:01:25.174
из коробки набор экземпляров S'L,

00:01:25.174 --> 00:01:27.890
которые могут сделать большую часть
распределенная работа для вас.

00:01:27.890 --> 00:01:28.930
Хорошо, хорошо.

00:01:28.930 --> 00:01:32.540
Запросы могут использоваться
вычислительный пул или не использовать

00:01:32.540 --> 00:01:35.540
вычислительный пул в зависимости от
по типу запроса.

00:01:35.540 --> 00:01:38.570
Какой сценарий я бы
выбрать пул вычислений?

00:01:38.570 --> 00:01:40.720
Да, да. Прекрасно
Вопрос. Так что давайте посмотрим.

00:01:40.720 --> 00:01:44.270
Одним из распространенных сценариев является
сказать, что у вас есть два каталога в

00:01:44.270 --> 00:01:45.950
HDFS с сотнями и тысячами

00:01:45.950 --> 00:01:48.355
файлы, и вы хотите присоединиться к ним.

00:01:48.355 --> 00:01:50.000
Так что в этом сценарии,

00:01:50.000 --> 00:01:53.390
Вы не хотите, чтобы получить все
данные на ваш сервер S'L.

00:01:53.390 --> 00:01:53.720
Нет.

00:01:53.720 --> 00:01:55.760
Который работает с вашим приложением.

00:01:55.760 --> 00:01:57.785
Так вот где
вычислить пул помогает.

00:01:57.785 --> 00:02:02.270
Таким образом, он может разгрузить большую часть
работа к HDFS

00:02:02.270 --> 00:02:03.680
, а затем позже тянуть

00:02:03.680 --> 00:02:07.490
необходимые данные для вычисления
бассейн и сделать присоединиться там.

00:02:07.490 --> 00:02:09.920
Так что это в основном разгружает их всех,

00:02:09.920 --> 00:02:13.520
вычислительный мир к различным
Машины сервера S'L, которые могут быть

00:02:13.520 --> 00:02:17.545
на разных узлах в
что кластер больших данных,

00:02:17.545 --> 00:02:19.895
и использовать эти ресурсы.

00:02:19.895 --> 00:02:21.590
Затем другие сценарии,

00:02:21.590 --> 00:02:23.570
вы присоединяетесь к данным из

00:02:23.570 --> 00:02:26.780
различные источники данных, которые
разделены по-разному.

00:02:26.780 --> 00:02:31.760
Так что вы должны объединить, что
раздела в какой-то момент,

00:02:31.760 --> 00:02:33.530
и вот где
вычислить пул помогает.

00:02:33.530 --> 00:02:34.145
Хорошо, хорошо.

00:02:34.145 --> 00:02:36.710
Так что, если одна таблица распределена

00:02:36.710 --> 00:02:40.465
Идентификатор клиента и еще один
распространяется идентификатором заказа,

00:02:40.465 --> 00:02:43.400
и вы все еще
присоединение по ИДент клиента,

00:02:43.400 --> 00:02:46.590
он может сделать это
примирение для вас.

00:02:46.590 --> 00:02:47.400
Хорошо, хорошо.

00:02:47.400 --> 00:02:50.070
Так что это некоторые из сценариев.

00:02:50.070 --> 00:02:54.259
Вы также можете делать такие вещи, как
экспорт данных в HDFS,

00:02:54.259 --> 00:02:56.930
и это другое место
где вычислительный пул может помочь.

00:02:56.930 --> 00:02:59.090
Хорошо, хорошо. Таким образом, вычислить
бассейн поможет мне

00:02:59.090 --> 00:03:01.550
параллелизовать, масштабировать
мой «неразборчиво».

00:03:01.550 --> 00:03:02.185
Да, да.

00:03:02.185 --> 00:03:05.430
Как чтение от HDFS
и писать в HDFS на всех?

00:03:05.430 --> 00:03:06.030
Да, да.

00:03:06.030 --> 00:03:07.350
Прохладный. Как это работает?

00:03:07.350 --> 00:03:09.300
Я имею в виду, вы можете показать нам
немного о том, как это работает?

00:03:09.300 --> 00:03:12.605
Да, да. Уверен. Пойдем сюда.

00:03:12.605 --> 00:03:16.885
Я на самом деле подключен к
Кластер больших данных сервера S'L,

00:03:16.885 --> 00:03:19.655
и, в частности, Овладение
экземпляр показан здесь.

00:03:19.655 --> 00:03:22.280
Итак, теперь у нас есть новый DMV,

00:03:22.280 --> 00:03:24.775
который называется вычислительных пулов.

00:03:24.775 --> 00:03:25.545
Хорошо, хорошо.

00:03:25.545 --> 00:03:28.610
В основном, это показывает,
вычислительные пулы, которые

00:03:28.610 --> 00:03:31.955
подготовлены и доступны
в кластере больших данных.

00:03:31.955 --> 00:03:35.960
По умолчанию, есть только один и
мы показываем эту информацию здесь.

00:03:35.960 --> 00:03:38.110
Тогда вы также можете увидеть

00:03:38.110 --> 00:03:42.465
сколько узлов на самом деле
там, в вычислительном пуле.

00:03:42.465 --> 00:03:44.740
Этот запрос на самом деле показывает,

00:03:44.740 --> 00:03:47.525
кроме этого конкретного
Экземпляр сервера S'L,

00:03:47.525 --> 00:03:49.100
У меня есть два вычисления

00:03:49.100 --> 00:03:52.730
экземпляры пула, как показано на
эти выделенные строки, не так ли?

00:03:52.730 --> 00:03:53.405
Да, да.

00:03:53.405 --> 00:03:57.815
Есть и другие DMV, которые
Вы можете использовать в основном найти

00:03:57.815 --> 00:04:03.195
информация о вычислениях
пул, как, как деятельность процессора,

00:04:03.195 --> 00:04:05.745
сколько памяти было выделено,

00:04:05.745 --> 00:04:09.900
является ли он даже доступен для
запрос и так далее, не так ли?

00:04:09.900 --> 00:04:10.200
В-право.

00:04:10.200 --> 00:04:12.470
Это информация,
который dBA может

00:04:12.470 --> 00:04:15.095
использовать для устранения неполадок в пуле вычислений.

00:04:15.095 --> 00:04:16.145
Конечно же.

00:04:16.145 --> 00:04:20.480
Кроме того, вы можете
запустить сложный запрос в

00:04:20.480 --> 00:04:25.955
Сервер S'L, который может на самом деле
пойти и использовать вычислительный пул.

00:04:25.955 --> 00:04:26.270
Хорошо, хорошо.

00:04:26.270 --> 00:04:27.565
Итак, в этом примере

00:04:27.565 --> 00:04:32.869
Я присоединяюсь к локальной таблице в S'L
Сервер с некоторыми данными в HDFS,

00:04:32.869 --> 00:04:37.070
и у меня также есть таблица в
Оракул, о чем я задаю.

00:04:37.070 --> 00:04:40.265
Таким образом, вы можете в основном запустить запрос и

00:04:40.265 --> 00:04:42.290
оптимизатор запроса
автоматически цифры

00:04:42.290 --> 00:04:44.570
как использовать пул вычислений.

00:04:44.570 --> 00:04:47.630
В этом случае, это будет
использовать компьютерный пул для

00:04:47.630 --> 00:04:50.930
таблица HDFS и

00:04:50.930 --> 00:04:54.490
остальные данные
все присоединились и вернулись.

00:04:54.490 --> 00:04:57.030
Это пример
где вычислительный пул

00:04:57.030 --> 00:05:00.060
прозрачно работает, чтобы
получить результаты для вас.

00:05:00.060 --> 00:05:01.755
Прохладный. Это выглядит очень хорошо.

00:05:01.755 --> 00:05:04.220
В принципе, я могу написать этот запрос.

00:05:04.220 --> 00:05:07.040
Теперь я могу доверять
вычислить пул сделает шаг

00:05:07.040 --> 00:05:10.010
в том, где имеет смысл
оптимизировать производительность, правильно?

00:05:10.010 --> 00:05:10.535
Да, да.

00:05:10.535 --> 00:05:13.115
Awesome. Ну, спасибо
много для обмена.

00:05:13.115 --> 00:05:14.015
Конечно же.

00:05:14.015 --> 00:05:15.500
Надеюсь, что это было полезно.

00:05:15.500 --> 00:05:20.150
Пожалуйста, нравится или подписаться
к видео и комментарии.

00:05:20.150 --> 00:05:22.340
Надеюсь увидеть тебя в следующий раз.
Спасибо за просмотр.

00:05:22.340 --> 00:05:36.910
(МУЗЫКА)

