WEBVTT

00:00:00.000 --> 00:00:03.000
>> SQL Server 2019 duży
Klastry danych zapewniają

00:00:03.000 --> 00:00:06.585
pule obliczeniowe do odciążania
przetwarzania kwerend rozproszonych.

00:00:06.585 --> 00:00:10.350
UC jest tutaj, aby opowiedzieć nam o
dziś na danych narażonych.

00:00:10.350 --> 00:00:21.060
MUZYKI

00:00:21.060 --> 00:00:25.215
>> Cześć. Witamy w innym odcinku
Narażonych danych. Jestem Jeroen.

00:00:25.215 --> 00:00:27.810
Dzisiaj dołączyłem do UC
rozmawiać o obliczeniowym

00:00:27.810 --> 00:00:30.690
pule w programie SQL Server
2019 klastry Big Data.

00:00:30.690 --> 00:00:33.000
Cześć, UC. Dzięki za
ponownie dołączyć do pokazu.

00:00:33.000 --> 00:00:34.155
>> Pewnie.

00:00:34.155 --> 00:00:36.060
>> Pule obliczeniowe?

00:00:36.060 --> 00:00:36.615
>> tak.

00:00:36.615 --> 00:00:37.815
>> Czym one są?

00:00:37.815 --> 00:00:40.980
>> Pule obliczeniowe. Są one

00:00:40.980 --> 00:00:44.430
zasadniczo wystąpienia programu SQL Server
w klastrze wielkich zbiorów danych,

00:00:44.430 --> 00:00:48.725
które mogą być użyte do odciążania
przetwarzania kwerend rozproszonych.

00:00:48.725 --> 00:00:50.310
Więc na tym zdjęciu,

00:00:50.310 --> 00:00:54.870
widzimy wiele elementów w
Klaster dużych zbiorów danych programu SQL Server.

00:00:54.870 --> 00:00:58.570
Dzisiaj przyjrzymy się
tej puli obliczeń tutaj.

00:00:58.570 --> 00:01:01.710
Więc co to jest? Jest to
w zasadzie zestaw

00:01:01.710 --> 00:01:03.825
Wystąpienia programu SQL Server, które są

00:01:03.825 --> 00:01:06.685
automatycznie pobierane
wewnątrz klastra danych Big Data,

00:01:06.685 --> 00:01:10.475
i są one dostępne dla
wykonywanie kwerend rozproszonych.

00:01:10.475 --> 00:01:11.405
>> Okay.

00:01:11.405 --> 00:01:14.030
>> Jest to podobne do PolyBase

00:01:14.030 --> 00:01:17.585
Skalowanie w górę grupy w SQL Server 2016.

00:01:17.585 --> 00:01:21.490
Ta funkcja zapewnia teraz

00:01:21.490 --> 00:01:25.174
out-of--Box zestaw wystąpień SQL,

00:01:25.174 --> 00:01:27.890
które mogą zrobić większość
rozproszonej pracy dla Ciebie.

00:01:27.890 --> 00:01:28.930
>> Okay.

00:01:28.930 --> 00:01:32.540
>> Kwerendy mogą używać
puli obliczeń lub nie używać

00:01:32.540 --> 00:01:35.540
puli obliczeń w zależności od
na typ kwerendy.

00:01:35.540 --> 00:01:38.570
>> Jaki scenariusz
wybrać dla puli obliczeniowej?

00:01:38.570 --> 00:01:40.720
>> tak. Wielki
Pytanie. Zobaczmy więc.

00:01:40.720 --> 00:01:44.270
Jednym z typowych scenariuszy jest
mówisz, że masz dwa katalogi w

00:01:44.270 --> 00:01:45.950
HDFS z setkami i tysiącami

00:01:45.950 --> 00:01:48.355
pliki i chcesz do nich dołączyć.

00:01:48.355 --> 00:01:50.000
Tak więc w tym scenariuszu

00:01:50.000 --> 00:01:53.390
nie chcesz uzyskać wszystkich
danych do programu SQL Server.

00:01:53.390 --> 00:01:53.720
>> Nie.

00:01:53.720 --> 00:01:55.760
>> Który jest uruchomiony aplikacji.

00:01:55.760 --> 00:01:57.785
Więc to, gdzie
puli obliczeń pomaga.

00:01:57.785 --> 00:02:02.270
Więc może odładowuje większość
pracy nad HDFS

00:02:02.270 --> 00:02:03.680
a następnie pociągnij

00:02:03.680 --> 00:02:07.490
niezbędne dane do obliczeń
basen i zrobić tam dołączyć.

00:02:07.490 --> 00:02:09.920
Więc to w zasadzie odciąża je wszystkie,

00:02:09.920 --> 00:02:13.520
świata obliczeniowego do różnych
SQL servermaszyny, które mogą być

00:02:13.520 --> 00:02:17.545
w różnych węzłach w
że klaster wielkich zbiorów danych,

00:02:17.545 --> 00:02:19.895
i wykorzystywać te zasoby.

00:02:19.895 --> 00:02:21.590
Następnie inne scenariusze,

00:02:21.590 --> 00:02:23.570
łączeniu danych z

00:02:23.570 --> 00:02:26.780
różnych źródeł danych, które
są podzielone na partycje inaczej.

00:02:26.780 --> 00:02:31.760
Więc trzeba zjednoczy się, że
partycjonowanie w pewnym momencie,

00:02:31.760 --> 00:02:33.530
i tam, gdzie
puli obliczeń pomaga.

00:02:33.530 --> 00:02:34.145
>> Okay.

00:02:34.145 --> 00:02:36.710
>> Więc jeśli jedna tabela jest rozprowadzana przez

00:02:36.710 --> 00:02:40.465
Identyfikator klienta i inny jest
dystrybuowane według identyfikatora zamówienia,

00:02:40.465 --> 00:02:43.400
i nadal jesteś
dołączenie do identyfikatora klienta,

00:02:43.400 --> 00:02:46.590
może to zrobić
pojednania.

00:02:46.590 --> 00:02:47.400
>> Okay.

00:02:47.400 --> 00:02:50.070
>> Więc to niektóre scenariusze.

00:02:50.070 --> 00:02:54.259
Można również wykonywać takie czynności, jak
Eksportowanie danych do systemu HDFS,

00:02:54.259 --> 00:02:56.930
i to jest inne miejsce
może pomóc Pula obliczeń.

00:02:56.930 --> 00:02:59.090
>> Okay. Tak więc obliczenia
basen pomoże mi

00:02:59.090 --> 00:03:01.550
parallelize, skalowanie
[niesłyszalny].

00:03:01.550 --> 00:03:02.185
>> tak.

00:03:02.185 --> 00:03:05.430
>> Zarówno odczyt z systemu HDFS
i pisania na HDFS w ogóle?

00:03:05.430 --> 00:03:06.030
>> Tak.

00:03:06.030 --> 00:03:07.350
>> Cool. Jak to działa?

00:03:07.350 --> 00:03:09.300
To znaczy, czy możesz pokazać nam
trochę jak to działa?

00:03:09.300 --> 00:03:12.605
>> tak. Pewien. Chodźmy tutaj.

00:03:12.605 --> 00:03:16.885
Jestem rzeczywiście podłączony do
Klaster dużych zbiorów danych programu SQL Server,

00:03:16.885 --> 00:03:19.655
a konkretnie opanowany
przykład przedstawiono tutaj.

00:03:19.655 --> 00:03:22.280
Teraz mamy nowy DMV,

00:03:22.280 --> 00:03:24.775
który nazywa się pule obliczeniowe.

00:03:24.775 --> 00:03:25.545
>> Okay.

00:03:25.545 --> 00:03:28.610
>> Zasadniczo pokazuje
pule obliczeniowe, które

00:03:28.610 --> 00:03:31.955
są udostępniane i dostępne
w klastrze wielkich zbiorów danych.

00:03:31.955 --> 00:03:35.960
Domyślnie jest tylko jeden i
pokazujemy te informacje tutaj.

00:03:35.960 --> 00:03:38.110
Następnie można również zobaczyć

00:03:38.110 --> 00:03:42.465
Ile węzłów jest faktycznie
w puli obliczeń.

00:03:42.465 --> 00:03:44.740
Ta kwerenda faktycznie pokazuje,

00:03:44.740 --> 00:03:47.525
Oprócz tego szczególnego
Wystąpienie programu SQL Server,

00:03:47.525 --> 00:03:49.100
Mam dwa obliczenia

00:03:49.100 --> 00:03:52.730
wystąpienia puli, jak pokazano
te wyróżnione wiersze, prawda?

00:03:52.730 --> 00:03:53.405
>> tak.

00:03:53.405 --> 00:03:57.815
>> Istnieją inne DMVs, które
można użyć w zasadzie znaleźć

00:03:57.815 --> 00:04:03.195
informacje na temat obliczeń
basen jak jak jest aktywność CPU,

00:04:03.195 --> 00:04:05.745
ile pamięci przydzielono,

00:04:05.745 --> 00:04:09.900
Czy jest nawet dostępna dla
zapytanie i tak dalej, prawda?

00:04:09.900 --> 00:04:10.200
>> W prawo.

00:04:10.200 --> 00:04:12.470
>> Są to informacje
którym DBA może

00:04:12.470 --> 00:04:15.095
umożliwia rozwiązywanie problemów z puli obliczeń.

00:04:15.095 --> 00:04:16.145
>> Pewnie.

00:04:16.145 --> 00:04:20.480
>> Możesz również
uruchomić złożoną kwerendę w

00:04:20.480 --> 00:04:25.955
Program SQL Server, który może faktycznie
Przejdź i użyj puli obliczeń.

00:04:25.955 --> 00:04:26.270
>> Okay.

00:04:26.270 --> 00:04:27.565
>> W tym przykładzie

00:04:27.565 --> 00:04:32.869
Przyłączam się do lokalnej tabeli w programie SQL
Serwer z niektórymi danymi w HDFS,

00:04:32.869 --> 00:04:37.070
i mam również tabelę w
Oracle, które jestem zapytań.

00:04:37.070 --> 00:04:40.265
Więc można w zasadzie uruchomić zapytanie i

00:04:40.265 --> 00:04:42.290
Optymalizator kwerend
automatycznie dane liczbowe

00:04:42.290 --> 00:04:44.570
Jak korzystać z puli obliczeń.

00:04:44.570 --> 00:04:47.630
W tym przypadku, to będzie
używać puli komputerów do

00:04:47.630 --> 00:04:50.930
tabeli HDFS i

00:04:50.930 --> 00:04:54.490
reszta danych jest
wszystkie połączone i zwrócone.

00:04:54.490 --> 00:04:57.030
To jest przykład
gdzie Pula obliczeń

00:04:57.030 --> 00:05:00.060
działa w sposób przejrzysty
uzyskać wyniki dla Ciebie.

00:05:00.060 --> 00:05:01.755
>> Cool. To wygląda naprawdę dobrze.

00:05:01.755 --> 00:05:04.220
Zasadniczo mogę napisać tę kwerendę.

00:05:04.220 --> 00:05:07.040
Teraz mogę zaufać
puli obliczeń zrobi krok

00:05:07.040 --> 00:05:10.010
w którym ma sens
optymalizacji wydajności, poprawne?

00:05:10.010 --> 00:05:10.535
>> Tak.

00:05:10.535 --> 00:05:13.115
>> Awesome. Cóż, dzięki
dużo do dzielenia się.

00:05:13.115 --> 00:05:14.015
>> Pewnie.

00:05:14.015 --> 00:05:15.500
>> Mam nadzieję, że to było użyteczne.

00:05:15.500 --> 00:05:20.150
Podobać się podobny albo subskrypcja
do filmu i komentarza.

00:05:20.150 --> 00:05:22.340
Nadzieję, że do zobaczenia następnym razem.
Dziękujemy za oglądanie.

00:05:22.340 --> 00:05:36.910
MUZYKI

