WEBVTT

00:00:00.000 --> 00:00:03.070
>> SQL Server 2019 velký
datové clustery poskytují

00:00:03.070 --> 00:00:04.950
Fondy dat pro optimalizaci

00:00:04.950 --> 00:00:07.905
Dotazovat se na výkon při dosažení
na více zdrojů.

00:00:07.905 --> 00:00:10.080
Umachandar je tu s
nás dnes, abychom nám řekli vše

00:00:10.080 --> 00:00:12.450
o něm dnes v datech vystavených.

00:00:12.450 --> 00:00:23.550
[HUDBA].

00:00:23.550 --> 00:00:26.250
>> Hi a Vítejte v jiném
epizodu exponovaných dat.

00:00:26.250 --> 00:00:29.100
Jsem váš hostitel Jeroen a
Dnes vidíme, že nás

00:00:29.100 --> 00:00:32.085
hovořit o fondech dat
v clusterech s velkými daty SQL.

00:00:32.085 --> 00:00:33.675
Ahoj Umachandar Vítej v show.

00:00:33.675 --> 00:00:35.460
>> Ahoj, jsem šťastný, že jsem tady.

00:00:35.460 --> 00:00:38.160
>> Takže datové fondy v
velkých datových clusterů.

00:00:38.160 --> 00:00:40.505
Co to je? Co potřebuji vědět?

00:00:40.505 --> 00:00:42.440
>> Jistě Ano, dovolte mi rychle začít

00:00:42.440 --> 00:00:45.110
tím, že zobrazí, co je
Velký datový cluster je.

00:00:45.110 --> 00:00:48.090
Tento snímek tedy ukazuje nasazení

00:00:48.090 --> 00:00:52.110
SQL Server 19-velká data
Cluster a dnes jsme

00:00:52.110 --> 00:00:56.360
hovořit o datech
Bazény, které jsou v podstatě

00:00:56.360 --> 00:00:59.300
dvě instance serveru SQL, které lze

00:00:59.300 --> 00:01:02.960
používá ke snížení zátěže některých
dotaz [neslyšitelný].

00:01:02.960 --> 00:01:04.810
Podíváme se tedy, co je to fond dat.

00:01:04.810 --> 00:01:08.390
Proto je to v podstatě server SQL
skladování a výpočet, který je

00:01:08.390 --> 00:01:13.550
poskytované pro zápis dotazů
a uložit data do fondu dat.

00:01:13.550 --> 00:01:16.310
Lze s ním manipulovat spuštěním

00:01:16.310 --> 00:01:20.900
Některé operace externích tabulek
a naplnit data

00:01:20.900 --> 00:01:24.440
do fondu dat a
později můžete

00:01:24.440 --> 00:01:28.970
převedení některých analytických
dotazy do tohoto fondu dat.

00:01:28.970 --> 00:01:32.400
To je primární
účel fondu dat.

00:01:32.400 --> 00:01:37.140
Takže teď si můžeme rychle vzít
podívat se na některé scénáře.

00:01:37.140 --> 00:01:39.980
Takže běžným scénářem je, že jste

00:01:39.980 --> 00:01:42.710
získání dat z
různých zdrojů dat,

00:01:42.710 --> 00:01:44.570
Některé z nich jsou rychlé,

00:01:44.570 --> 00:01:47.345
ostatní jsou v přírodě pomalejší.

00:01:47.345 --> 00:01:51.050
Takže nyní chcete v podstatě optimalizovat

00:01:51.050 --> 00:01:55.535
Tento dotaz, abyste mohli
skutečně vzít tento dotaz

00:01:55.535 --> 00:02:00.350
a uložte výsledky do
Fond dat umožňuje

00:02:00.350 --> 00:02:02.900
používá se v podstatě jako

00:02:02.900 --> 00:02:07.300
pracovní oblast, ve které
může spustit veškerou vaši analytiku.

00:02:07.300 --> 00:02:10.830
Dalším příkladem je, pokud jste
učení strojů,

00:02:10.830 --> 00:02:12.830
je tu spousta
scénáře, ve kterých

00:02:12.830 --> 00:02:14.960
by vygeneroval funkce
a stovky a

00:02:14.960 --> 00:02:18.290
tisíce funkcí a
Chcete v podstatě uložit

00:02:18.290 --> 00:02:23.040
datovou sadu v místě, kde
můžete provést opakovanou analýzu.

00:02:23.040 --> 00:02:26.145
To je další místo, kde
bude fond dat pomoci.

00:02:26.145 --> 00:02:29.540
>> Takže v tom případě to není
pouze pro optimalizaci dotazu

00:02:29.540 --> 00:02:31.190
ale také pro zajištění
Nemusíš jít

00:02:31.190 --> 00:02:32.975
zpět do zdroje dat
pořád, že?

00:02:32.975 --> 00:02:33.230
>> Ano.

00:02:33.230 --> 00:02:34.385
>> Pokud chcete data znovu použít.

00:02:34.385 --> 00:02:34.625
>> Ano.

00:02:34.625 --> 00:02:35.660
>> Super, to zní super.

00:02:35.660 --> 00:02:37.355
Takže můžeš
Ukázat nám, jak to funguje?

00:02:37.355 --> 00:02:40.550
>> Ano, rychle Pojďme
zhodnotit, kolik je zde.

00:02:40.550 --> 00:02:42.230
To, co tu mám, je

00:02:42.230 --> 00:02:45.530
připojení k serveru SQL
Velký datový cluster serveru.

00:02:45.530 --> 00:02:48.890
Jsem připojen k SQL
Instance hlavního serveru.

00:02:48.890 --> 00:02:51.905
Způsob vytvoření fondu dat

00:02:51.905 --> 00:02:55.625
nejprve vytvořením
Tento objekt zdroje dat.

00:02:55.625 --> 00:02:58.100
Takže tady, jak to jméno naznačuje

00:02:58.100 --> 00:03:01.325
Tady to v podstatě říká, co
typ zdroje dat.

00:03:01.325 --> 00:03:04.400
Tak to se chystám
připojit ke fondu dat.

00:03:04.400 --> 00:03:05.530
>> Dobře.

00:03:05.530 --> 00:03:08.780
>> Tak jsi
vytvořit. Poté

00:03:08.780 --> 00:03:11.360
definujete tabulku
které chcete

00:03:11.360 --> 00:03:13.940
Uložit do dat
Bazén a hotovo

00:03:13.940 --> 00:03:16.670
spuštěním této externí
příkazu tabulky.

00:03:16.670 --> 00:03:17.845
>> Dobře.

00:03:17.845 --> 00:03:21.090
>> Toto vypadá jako běžný
Vytvoření příkazu tabulky,

00:03:21.090 --> 00:03:24.110
existují sloupce, které
je nutné definovat a v

00:03:24.110 --> 00:03:27.725
sčítání, protože existuje mnoho SQL
instancí serveru v back-end systému.

00:03:27.725 --> 00:03:28.115
>> Správně.

00:03:28.115 --> 00:03:30.740
>> Stačí říct, jak se
Chcete distribuovat data.

00:03:30.740 --> 00:03:32.630
>> Tak s tímhle můžeš říct, dobře,

00:03:32.630 --> 00:03:36.155
Takže máme dokonce ani přibližně
dokonce i distribuce napříč.

00:03:36.155 --> 00:03:36.515
>> Ano.

00:03:36.515 --> 00:03:37.400
>> Přes službu.

00:03:37.400 --> 00:03:37.685
>> Ano.

00:03:37.685 --> 00:03:38.000
>> Dobře.

00:03:38.000 --> 00:03:41.330
>> Tak to je ten kulatý Robin
je v podstatě distribuovat

00:03:41.330 --> 00:03:44.825
data mezi tolika
Instance fondu dat, které máte.

00:03:44.825 --> 00:03:45.865
>> Dobře.

00:03:45.865 --> 00:03:49.370
>> Další věc, kterou můžete
je jako dotaz na data.

00:03:49.370 --> 00:03:50.780
Takže se nejprve podíváme na

00:03:50.780 --> 00:03:54.155
Vzorová data, která v
Tento příklad mám v

00:03:54.155 --> 00:03:57.680
Adresář HDFS a v podstatě

00:03:57.680 --> 00:04:00.155
Chci si vzít tyhle
data clickstream,

00:04:00.155 --> 00:04:04.490
provést dotaz a naplnit jej
do datového fondu.

00:04:04.490 --> 00:04:08.915
Způsob, jakým to uděláte, je
spuštění pouze příkazu INSERT.

00:04:08.915 --> 00:04:13.490
Takže zdroj inzertu
příkaz je pouze SQL dotaz,

00:04:13.490 --> 00:04:18.140
a můžete jednoduše spustit
zadat dotaz a naplnit data.

00:04:18.140 --> 00:04:21.320
Nebudu utíkat skrz
Vložit, ale rychle

00:04:21.320 --> 00:04:25.205
Zobrazit data, která jsou již
zaplněno ve fondu dat.

00:04:25.205 --> 00:04:28.445
Tento dotaz by se měl vrátit
asi 2 000 řádků, že?

00:04:28.445 --> 00:04:32.930
Takže teď stejně jako každý jiný
tabulku, ke které se můžete skutečně připojit

00:04:32.930 --> 00:04:37.460
tuto tabulku s jinými tabulkami
na serveru SQL Server a získejte

00:04:37.460 --> 00:04:39.680
výsledky a průhledně

00:04:39.680 --> 00:04:42.200
tuto instanci serveru SQL Server
bude mluvit s

00:04:42.200 --> 00:04:47.555
instance fondu dat ke spuštění
dotazy a získat výsledky.

00:04:47.555 --> 00:04:50.330
Takže to je na vysoké úrovni
o tom, co je fond dat.

00:04:50.330 --> 00:04:51.530
>> Super úžasný.

00:04:51.530 --> 00:04:54.390
To je velmi působivé.
Díky moc.

00:04:54.390 --> 00:04:55.530
>> Cool Ano, díky.

00:04:55.530 --> 00:04:58.050
>> Dobře. Díky za sledování.

00:04:58.050 --> 00:04:59.590
Prosím, jako předplatit,

00:04:59.590 --> 00:05:02.150
komentář k videu
Jestli chcete, abychom

00:05:02.150 --> 00:05:06.360
zaznamenat něco jiného a doufat
Uvidíme se příště. Dík.

00:05:06.360 --> 00:05:20.860
HUDBY

