WEBVTT

00:00:00.000 --> 00:00:03.070
>> SQL Server 2019 duży
klastry danych dostarczają

00:00:03.070 --> 00:00:04.950
Pule danych do optymalizacji

00:00:04.950 --> 00:00:07.905
wydajność zapytań po osiągnięciu
do wielu źródeł.

00:00:07.905 --> 00:00:10.080
Umachandar jest tutaj z
nas dzisiaj, aby opowiedzieć nam

00:00:10.080 --> 00:00:12.450
o tym dzisiaj na Data Exposed.

00:00:12.450 --> 00:00:23.550
[MUZYKA].

00:00:23.550 --> 00:00:26.250
>> Witam i zapraszam na inny
odcinek danych narażonych.

00:00:26.250 --> 00:00:29.100
Jestem gospodarzem Jeroen i
Dziś widzimy nas

00:00:29.100 --> 00:00:32.085
Aby porozmawiać o pule danych
w klastrach dużych zbiorów danych SQL.

00:00:32.085 --> 00:00:33.675
Witam Umachandar Witamy na wystawie.

00:00:33.675 --> 00:00:35.460
>> Witam, Cieszę się, że jestem tutaj.

00:00:35.460 --> 00:00:38.160
>> Więc pule danych w
klastrów dużych zbiorów danych.

00:00:38.160 --> 00:00:40.505
Co to? Co muszę wiedzieć?

00:00:40.505 --> 00:00:42.440
>> Pewnie tak, pozwól mi szybko zacząć

00:00:42.440 --> 00:00:45.110
pokazując, co
Klaster Big Data jest.

00:00:45.110 --> 00:00:48.090
Tak więc ten slajd pokazuje rozmieszczenie

00:00:48.090 --> 00:00:52.110
Dane Big Data programu SQL Server 19
Klaster i dziś jesteśmy

00:00:52.110 --> 00:00:56.360
porozmawiamy o danych
Baseny tutaj, które są w zasadzie

00:00:56.360 --> 00:00:59.300
dwa wystąpienia serwera SQL, które mogą być

00:00:59.300 --> 00:01:02.960
używane do odciążania niektórych
zapytanie [niesłyszalne].

00:01:02.960 --> 00:01:04.810
Zobaczmy więc, co to jest pula danych.

00:01:04.810 --> 00:01:08.390
Więc to w zasadzie SQL Server
magazynowania i obliczeń, które

00:01:08.390 --> 00:01:13.550
dostarczone do pisania zapytań
i przechowywać dane w puli danych.

00:01:13.550 --> 00:01:16.310
Może być manipulowane przez uruchomienie

00:01:16.310 --> 00:01:20.900
Niektóre operacje na stole zewnętrznym
na nim i wypełnić dane

00:01:20.900 --> 00:01:24.440
do puli danych i
później można rzeczywiście

00:01:24.440 --> 00:01:28.970
odciążania niektórych analitycznej
zapytań do tej puli danych.

00:01:28.970 --> 00:01:32.400
Tak więc jest podstawowym
celu puli danych.

00:01:32.400 --> 00:01:37.140
Więc teraz niech może być szybko podjąć
przyjrzeć się niektórym scenariuszom.

00:01:37.140 --> 00:01:39.980
Więc typowym scenariuszem jest to, że jesteś

00:01:39.980 --> 00:01:42.710
Pobieranie danych z
różnych źródeł danych,

00:01:42.710 --> 00:01:44.570
Niektóre z nich są szybkie,

00:01:44.570 --> 00:01:47.345
inne są wolniejsze w przyrodzie.

00:01:47.345 --> 00:01:51.050
Więc teraz chcesz w zasadzie zoptymalizować

00:01:51.050 --> 00:01:55.535
Tę kwerendę, dzięki czemu można
faktycznie podjąć tę kwerendę

00:01:55.535 --> 00:02:00.350
i zapisać wyniki w
Data Pool, a to pozwala na

00:02:00.350 --> 00:02:02.900
w zasadzie użyć, że jak

00:02:02.900 --> 00:02:07.300
obszar przejściowy, w którym
można uruchomić wszystkie analizy.

00:02:07.300 --> 00:02:10.830
Innym przykładem jest, jeśli jesteś
Uczenie maszynowe,

00:02:10.830 --> 00:02:12.830
Istnieje wiele
scenariusze, w których

00:02:12.830 --> 00:02:14.960
wygenerowałoby funkcje
i setki

00:02:14.960 --> 00:02:18.290
tysiące funkcji i
chcesz w zasadzie przechowywać

00:02:18.290 --> 00:02:23.040
zbioru danych w miejscu, w którym
można powtórzyć analizę.

00:02:23.040 --> 00:02:26.145
To kolejne miejsce, gdzie
Puli danych pomaga.

00:02:26.145 --> 00:02:29.540
>> Więc w tym przypadku nie jest
tylko dla optymalizacji zapytań

00:02:29.540 --> 00:02:31.190
ale także dla upewnienia się,
nie musisz iść

00:02:31.190 --> 00:02:32.975
Powrót do źródła danych
cały czas, prawda?

00:02:32.975 --> 00:02:33.230
>> Tak.

00:02:33.230 --> 00:02:34.385
>> Jeśli chcesz ponownie użyć danych.

00:02:34.385 --> 00:02:34.625
>> tak.

00:02:34.625 --> 00:02:35.660
>> Cool, że brzmi bardzo fajnie.

00:02:35.660 --> 00:02:37.355
Tak naprawdę można
pokazać nam, jak to działa?

00:02:37.355 --> 00:02:40.550
>> tak, przejdźmy szybko
ocenić, ile jest tutaj.

00:02:40.550 --> 00:02:42.230
Więc co mam tutaj jest

00:02:42.230 --> 00:02:45.530
połączenie z SQL
Klaster dużych zbiorów danych serwera.

00:02:45.530 --> 00:02:48.890
Jestem podłączony do SQL
Wystąpienie wzorca serwera.

00:02:48.890 --> 00:02:51.905
Tak więc sposób tworzenia puli danych

00:02:51.905 --> 00:02:55.625
najpierw tworząc
tego obiektu źródła danych.

00:02:55.625 --> 00:02:58.100
Więc tutaj, jak ta nazwa wskazuje

00:02:58.100 --> 00:03:01.325
tutaj to w zasadzie mówi, co
Typ źródła danych jest.

00:03:01.325 --> 00:03:04.400
To mam zamiar
połączyć się z pulą danych.

00:03:04.400 --> 00:03:05.530
>> Okay.

00:03:05.530 --> 00:03:08.780
>> Tak
go utworzyć. Po tym

00:03:08.780 --> 00:03:11.360
definiowania tabeli
którego chcesz

00:03:11.360 --> 00:03:13.940
przechowywania danych w
Basen i to się robi

00:03:13.940 --> 00:03:16.670
uruchamiając tę zewnętrzną
instrukcji tabeli.

00:03:16.670 --> 00:03:17.845
>> Okay.

00:03:17.845 --> 00:03:21.090
>> To wygląda jak Twój regularny
Tworzenie instrukcji tabeli,

00:03:21.090 --> 00:03:24.110
Istnieją kolumny, które
należy zdefiniować i w

00:03:24.110 --> 00:03:27.725
Ponadto, ponieważ istnieje wiele SQL
wystąpienia serwera w wewnętrznej bazie danych.

00:03:27.725 --> 00:03:28.115
>> W prawo.

00:03:28.115 --> 00:03:30.740
>> Po prostu trzeba powiedzieć, jak
chcesz rozpowszechnić dane.

00:03:30.740 --> 00:03:32.630
>> Więc z tym można powiedzieć, w porządku,

00:03:32.630 --> 00:03:36.155
więc mamy nawet lub w przybliżeniu
równomierne rozłożenie w poprzek.

00:03:36.155 --> 00:03:36.515
>> tak.

00:03:36.515 --> 00:03:37.400
>> Przez usługę.

00:03:37.400 --> 00:03:37.685
>> Tak.

00:03:37.685 --> 00:03:38.000
>> Okay.

00:03:38.000 --> 00:03:41.330
>> Więc to, co okrężne
nie jest w zasadzie rozpowszechniać

00:03:41.330 --> 00:03:44.825
danych na temat liczby
Wystąpienia puli danych.

00:03:44.825 --> 00:03:45.865
>> Okay.

00:03:45.865 --> 00:03:49.370
>> Następną rzeczą, którą możesz
Czy jest jak zapytanie danych.

00:03:49.370 --> 00:03:50.780
Przyjrzyjmy się więc najpierw niektórym z

00:03:50.780 --> 00:03:54.155
dane przykładowe, które w
tym przykładzie mam w

00:03:54.155 --> 00:03:57.680
Katalog HDFS i w zasadzie

00:03:57.680 --> 00:04:00.155
Chcę wziąć te
dane strumienia kliknięć,

00:04:00.155 --> 00:04:04.490
zrobić kilka zapytań i wypełnić
do puli danych.

00:04:04.490 --> 00:04:08.915
Sposób, w jaki to zrobisz, to
uruchomiony tylko INSERT instrukcji.

00:04:08.915 --> 00:04:13.490
Tak więc źródło wkładki
Instrukcja jest tylko zapytanie SQL,

00:04:13.490 --> 00:04:18.140
i możesz po prostu uruchomić
kwerendę i wypełnić dane.

00:04:18.140 --> 00:04:21.320
JA przyzwyczajenie ' biegać przez ten
wkładek, ale szybko

00:04:21.320 --> 00:04:25.205
Zobacz dane, które są już
zapełniona w puli danych.

00:04:25.205 --> 00:04:28.445
Więc ta kwerenda powinna zwracać
około 2 000 wierszy, prawda?

00:04:28.445 --> 00:04:32.930
Więc teraz tak jak każdy inny
tabela, do której można dołączyć

00:04:32.930 --> 00:04:37.460
tej tabeli z innymi tabelami
w programie SQL Server i uzyskać

00:04:37.460 --> 00:04:39.680
wyniki i przejrzyście

00:04:39.680 --> 00:04:42.200
tego wystąpienia programu SQL Server
będzie rozmawiać z

00:04:42.200 --> 00:04:47.555
wystąpień puli danych do uruchomienia
zapytań i uzyskać wyniki.

00:04:47.555 --> 00:04:50.330
Więc to na wysokim poziomie
Puli danych.

00:04:50.330 --> 00:04:51.530
>> Cool awesome.

00:04:51.530 --> 00:04:54.390
To bardzo imponujące.
Bardzo dziękuję człowiek.

00:04:54.390 --> 00:04:55.530
>> Cool tak, dzięki.

00:04:55.530 --> 00:04:58.050
>> Okay. Więc dzięki za oglądanie.

00:04:58.050 --> 00:04:59.590
Proszę jak i subskrybować,

00:04:59.590 --> 00:05:02.150
komentarz do filmu
Jeśli chcesz, abyśmy

00:05:02.150 --> 00:05:06.360
nagrać coś innego i nadziei
do zobaczenia następnym razem. Dzięki.

00:05:06.360 --> 00:05:20.860
MUZYKI

