WEBVTT

00:00:09.680 --> 00:00:10.780
>> [HUDBA].

00:00:10.780 --> 00:00:12.750
>> Ahoj. Jsem Vicki Harp s
produktového týmu serveru SQL Server.

00:00:12.750 --> 00:00:15.870
Jsem tu dnes, abych ti ukázal
Poznámkové bloky a Azure Data Studio.

00:00:15.870 --> 00:00:18.825
Poznámkové bloky tedy představují koncept v

00:00:18.825 --> 00:00:20.660
Vědecká věda, která byla

00:00:20.660 --> 00:00:22.940
používá se k mnoha
vizualizace dat,

00:00:22.940 --> 00:00:25.010
průzkum dat a práce s daty,

00:00:25.010 --> 00:00:26.855
primárně v jazyce Pythonu.

00:00:26.855 --> 00:00:28.760
Když lidé hovoří
o poznámkových blocích,

00:00:28.760 --> 00:00:30.485
Mnohokrát jsme si povídali
o poznámkových blocích Jupiteru.

00:00:30.485 --> 00:00:32.660
Takže implementace poznámkových bloků

00:00:32.660 --> 00:00:34.730
že máme v Azure Data Studio je

00:00:34.730 --> 00:00:37.070
Notebook Jupiter s
vlastní front-end

00:00:37.070 --> 00:00:40.430
lépe upraveny tak, aby odpovídaly
Prostředí Azure Data Studio.

00:00:40.430 --> 00:00:45.450
Tak zaprvé, ukážu
jednoduchý notebook v Pythonu.

00:00:45.450 --> 00:00:46.760
Toto je Poznámkový blok, který má

00:00:46.760 --> 00:00:49.250
Python jazyk a
můžeš vidět, že máme

00:00:49.250 --> 00:00:51.620
oddíl, který je

00:00:51.620 --> 00:00:54.395
člověkem čitelný text a
dolu, který má kód.

00:00:54.395 --> 00:00:56.149
Takže když na to narazím,

00:00:56.149 --> 00:00:58.010
Tento konkrétní kód volá

00:00:58.010 --> 00:01:00.755
Internetu a
náhodnou fotografii psa.

00:01:00.755 --> 00:01:03.710
Abych vám ukázal okolí
Zkušenost s notebookem,

00:01:03.710 --> 00:01:05.390
tady máme sběrač,

00:01:05.390 --> 00:01:06.770
Můžeme si vybrat jazyk.

00:01:06.770 --> 00:01:08.630
Takže v tom případě jsem
spuštění Pythonu 3,

00:01:08.630 --> 00:01:10.475
a já to dělám
v místním počítači.

00:01:10.475 --> 00:01:13.460
Místo toho bych se mohl přestěhovat do
jazyka SQL a poté

00:01:13.460 --> 00:01:16.430
Vyberte, který z MySQL serveru
počítačů, ke kterým se chci připojit.

00:01:16.430 --> 00:01:18.605
Mám zde seznam MySQL serverů.

00:01:18.605 --> 00:01:21.830
Abych to vzal trochu dál,

00:01:21.830 --> 00:01:24.230
Ukážu vám příklad
Jak to můžete použít.

00:01:24.230 --> 00:01:28.025
Takže zde mám SQL Server
2019 velký datový cluster, který

00:01:28.025 --> 00:01:32.555
je SQL Server spuštěný v Kubernetes
pomocí příkazů SQL a Spark.

00:01:32.555 --> 00:01:34.490
Zde v sekci HDFS

00:01:34.490 --> 00:01:38.040
Dostal jsem tenhle adresář
plný souborů CSV.

00:01:38.040 --> 00:01:40.890
Když se na to podívám, tak si ho Prohlédni,

00:01:40.890 --> 00:01:42.260
můžete vidět, že je to spousta

00:01:42.260 --> 00:01:44.780
informace o PSU
informace o licenci.

00:01:44.780 --> 00:01:46.970
Takže to je ve skutečnosti výpis dat

00:01:46.970 --> 00:01:48.320
Alehské hrabství v Pensylvánii

00:01:48.320 --> 00:01:51.230
Psí licence pro
posledních několika let.

00:01:51.230 --> 00:01:55.775
Takže použití jisker
jazyk a připojení

00:01:55.775 --> 00:02:00.440
do Pythonu s použitím Spark na
Velký datový cluster serveru SQL Server.

00:02:00.440 --> 00:02:02.045
Jsem schopná utéct,

00:02:02.045 --> 00:02:05.780
kód pro čtení těchto souborů
přímo ze souboru CSV.

00:02:05.780 --> 00:02:07.760
Pak můžu udělat nějakou analýzu.

00:02:07.760 --> 00:02:09.890
Takže v tom případě se chystám
zjištění počtu řádků.

00:02:09.890 --> 00:02:15.645
Chystám se vypsat zvláštní
seznam pouze těch jmen,

00:02:15.645 --> 00:02:17.215
Takže máme 25 000 jmen.

00:02:17.215 --> 00:02:20.825
Pak vytáhnu
z toho klobouku náhodné jméno.

00:02:20.825 --> 00:02:22.550
Takže tady máme jméno.

00:02:22.550 --> 00:02:25.850
Teď, když jsem použil jiskru,

00:02:25.850 --> 00:02:29.120
Kdybych byl velmi využíván k používání
Python, to by bylo super.

00:02:29.120 --> 00:02:30.770
Ale pokud jsem více než SQL člověk,

00:02:30.770 --> 00:02:33.320
Možná se chci připojit
na stejnou sadu dat,

00:02:33.320 --> 00:02:36.040
Budu spouštět cluster
pomocí jazyka SQL.

00:02:36.040 --> 00:02:41.420
Zde jsem vytvořil externí
tabulku přes tento formát souboru.

00:02:41.420 --> 00:02:43.870
To je něco, co jsi
lze použít pomocí průvodce.

00:02:43.870 --> 00:02:45.250
Já jdu sem,

00:02:45.250 --> 00:02:46.930
vytvořit externí tabulku ze souborů CSV.

00:02:46.930 --> 00:02:50.315
Tím by se vytvořila Tato
externí tabulku, kterou používám.

00:02:50.315 --> 00:02:52.415
Ale v tomto případě jsem
to udělal pomocí kódu.

00:02:52.415 --> 00:02:56.500
Pokud narazím na spuštěné buňky,

00:02:56.500 --> 00:02:59.765
můžete zjistit, že používám také SQL

00:02:59.765 --> 00:03:03.625
k přístupu ke stejným datům, která
Právě jsem se k nim připojil pomocí jiskru.

00:03:03.625 --> 00:03:07.410
Nyní jsou tyto soubory
uloženy jako soubory IPYNB,

00:03:07.410 --> 00:03:10.970
které pak mohu sdílet s mými
kolegové a mohu běžet znovu.

00:03:10.970 --> 00:03:14.465
Takže v tom případě, že jsem
chtěl dneska běžet,

00:03:14.465 --> 00:03:15.995
Pošlete to mému kolegovi,

00:03:15.995 --> 00:03:18.950
mohli by ji otevřít
v okamžiku a

00:03:18.950 --> 00:03:20.480
připojit jej k vlastnímu clusteru nebo

00:03:20.480 --> 00:03:22.535
do stejného clusteru a spustit jej znovu.

00:03:22.535 --> 00:03:24.800
Také používáte poznámkové bloky
několika dalšími způsoby.

00:03:24.800 --> 00:03:27.485
Tady máme něco
nazývají knihy Jupiteru.

00:03:27.485 --> 00:03:30.710
Toto je seznam v podstatě poznámkových bloků

00:03:30.710 --> 00:03:34.130
, které byly zkompilovány společně
do formátu stránky kapitoly.

00:03:34.130 --> 00:03:37.775
Tady máme SQL
Server ML, kurz služeb,

00:03:37.775 --> 00:03:40.985
která je zobrazena prostřednictvím poznámkových bloků.

00:03:40.985 --> 00:03:43.070
Takže máme všechny
dokumentaci.

00:03:43.070 --> 00:03:46.445
Máme ukázky kódu
a pak můžete,

00:03:46.445 --> 00:03:47.780
na konci každé kapitoly,

00:03:47.780 --> 00:03:49.730
buď zasáhli následující
přejdete na další

00:03:49.730 --> 00:03:52.400
jednu nebo použijte tuto kapitolu
prohlížeč vybrat.

00:03:52.400 --> 00:03:54.965
Máme také
Kniha podpory

00:03:54.965 --> 00:03:57.255
pro SQL Server 2019
Velké datové clustery.

00:03:57.255 --> 00:03:59.210
Kdybych vzal
příkaz, pilot a pick

00:03:59.210 --> 00:04:01.160
Tato kniha o Jupiteru 2019 příručka,

00:04:01.160 --> 00:04:03.035
To je to, co jsem používá, abych to otevřela.

00:04:03.035 --> 00:04:05.960
Tady máme všechny
informace, které můžete

00:04:05.960 --> 00:04:08.885
nutné pro podporu
nový velký datový cluster,

00:04:08.885 --> 00:04:11.585
Spousta příkazů v Kubernetes,
informace o clusteru.

00:04:11.585 --> 00:04:13.565
Tohle je něco, co můžeš spustit,

00:04:13.565 --> 00:04:14.735
můžete poslat někomu jinému,

00:04:14.735 --> 00:04:17.065
a můžete uložit a
dělat, co chceš.

00:04:17.065 --> 00:04:21.140
Takže jsme velmi nadšeni
Poznámkové bloky v Azure Data Studio.

00:04:21.140 --> 00:04:23.210
Opravdu si myslíme, že tohle
je něco, co bude

00:04:23.210 --> 00:04:26.210
pro naši komunitu velmi užitečný.

00:04:26.210 --> 00:04:28.040
Opravdu nás to zajímá
při zjišťování, jak

00:04:28.040 --> 00:04:29.765
používáte a
Co od nás chcete.

00:04:29.765 --> 00:04:32.800
Pokud vás tedy zajímá
více se dozvědět, přejděte do GitHub,

00:04:32.800 --> 00:04:34.610
Vyhledejte Azure Data Studio a Vy

00:04:34.610 --> 00:04:37.120
lze otevřít funkci
požadovat chyby mezi chybami.

00:04:37.120 --> 00:04:39.470
To je také místo, kde se
může stáhnout

00:04:39.470 --> 00:04:51.991
stabilní a přibývá insidery.
Děkuji mnohokrát za váš čas.

00:04:51.991 --> 00:04:57.040
>> [HUDBA]

