WEBVTT

00:00:09.680 --> 00:00:10.780
>> [MUZYKA].

00:00:10.780 --> 00:00:12.750
>> Cześć. Jestem harfą Vicki z
zespołu produktu SQL Server.

00:00:12.750 --> 00:00:15.870
Jestem tu dzisiaj, aby pokazać
Notebooki i Azure Data Studio.

00:00:15.870 --> 00:00:18.825
Więc notebooki są koncepcją w

00:00:18.825 --> 00:00:20.660
Nauka o danych, która została

00:00:20.660 --> 00:00:22.940
używane do wielu
Wizualizacja danych,

00:00:22.940 --> 00:00:25.010
Eksploracja danych i praca z danymi,

00:00:25.010 --> 00:00:26.855
głównie w języku Python.

00:00:26.855 --> 00:00:28.760
Kiedy ludzie mówią
o notebookach,

00:00:28.760 --> 00:00:30.485
wiele razy mówimy
o notatnikach Jupiter.

00:00:30.485 --> 00:00:32.660
Tak więc implementacja notebooków

00:00:32.660 --> 00:00:34.730
które mamy w usłudze Azure Data Studio jest

00:00:34.730 --> 00:00:37.070
Notebook Jupiter z
niestandardowy front-end, który jest

00:00:37.070 --> 00:00:40.430
lepiej dopasowane do potrzeb
Środowisko Azure Data Studio.

00:00:40.430 --> 00:00:45.450
Więc po pierwsze, mam zamiar pokazać
Ci prosty notatnik Python.

00:00:45.450 --> 00:00:46.760
Jest to Notebook, który ma

00:00:46.760 --> 00:00:49.250
Język Python i
widać, że mamy

00:00:49.250 --> 00:00:51.620
sekcję tutaj, która jest

00:00:51.620 --> 00:00:54.395
tekst czytelny dla człowieka i
sekcję w tym miejscu, który ma kod.

00:00:54.395 --> 00:00:56.149
Więc jeśli uderzyć uruchomić na tym,

00:00:56.149 --> 00:00:58.010
Ten konkretny kod wywołuje

00:00:58.010 --> 00:01:00.755
w Internecie i wyciąga
losowe zdjęcie psa.

00:01:00.755 --> 00:01:03.710
Aby pokazać Ci wokół
Doświadczenie notebooka,

00:01:03.710 --> 00:01:05.390
Mamy tutaj selektor,

00:01:05.390 --> 00:01:06.770
możemy wybrać język.

00:01:06.770 --> 00:01:08.630
Więc w tym przypadku, jestem
Uruchamianie Pythona 3,

00:01:08.630 --> 00:01:10.475
i używam go
na moim komputerze lokalnym.

00:01:10.475 --> 00:01:13.460
Zamiast tego mógłbym przejść do
języka SQL, a następnie

00:01:13.460 --> 00:01:16.430
wybrać, który z serwera MySQL
maszyn, do których chcę dołączyć.

00:01:16.430 --> 00:01:18.605
Mam serwery MySQL wymienione tutaj.

00:01:18.605 --> 00:01:21.830
Tak więc, aby wziąć go nieco dalej,

00:01:21.830 --> 00:01:24.230
Pokażę Ci przykład
jak możesz to wykorzystać.

00:01:24.230 --> 00:01:28.025
Więc tutaj mam SQL Server
2019 Big Data Cluster, który

00:01:28.025 --> 00:01:32.555
jest SQL Server uruchomiony w Kubernetes
z SQL i Spark.

00:01:32.555 --> 00:01:34.490
Więc tutaj w mojej sekcji HDFS,

00:01:34.490 --> 00:01:38.040
Dostałam ten katalog
pełne plików CSV.

00:01:38.040 --> 00:01:40.890
Jeśli Przyjrzę się, że Podgląd,

00:01:40.890 --> 00:01:42.260
widać, że to dużo

00:01:42.260 --> 00:01:44.780
Informacje o psa
Informacje o licencji.

00:01:44.780 --> 00:01:46.970
Więc jest to faktycznie zrzut danych z

00:01:46.970 --> 00:01:48.320
Hrabstwo Allegheny w Pensylwanii

00:01:48.320 --> 00:01:51.230
licencje dla psów
ostatnich kilku lat.

00:01:51.230 --> 00:01:55.775
Więc za pomocą Spark
język i łączenie

00:01:55.775 --> 00:02:00.440
do Pythona przy użyciu platformy Spark na
Klaster dużych zbiorów danych programu SQL Server.

00:02:00.440 --> 00:02:02.045
Jestem w stanie uruchomić,

00:02:02.045 --> 00:02:05.780
kod, aby odczytać te pliki
bezpośrednio z pliku CSV.

00:02:05.780 --> 00:02:07.760
Potem mogę zrobić jakąś analizę.

00:02:07.760 --> 00:02:09.890
Tak więc w tym przypadku zamierzam
uzyskać liczbę wierszy.

00:02:09.890 --> 00:02:15.645
Zamierzam wymienić odrębne
listę tylko nazw,

00:02:15.645 --> 00:02:17.215
więc mamy 25 000 nazwy.

00:02:17.215 --> 00:02:20.825
Potem mam zamiar wyciągnąć
losowej nazwy z tego kapelusza.

00:02:20.825 --> 00:02:22.550
Więc mamy tutaj nazwę.

00:02:22.550 --> 00:02:25.850
Teraz, jeśli używałem Spark,

00:02:25.850 --> 00:02:29.120
Gdybym był bardzo używany do korzystania
Python, to byłoby wspaniale.

00:02:29.120 --> 00:02:30.770
Ale jeśli jestem bardziej osobą SQL,

00:02:30.770 --> 00:02:33.320
wtedy może chcę się połączyć
do tego samego zbioru danych,

00:02:33.320 --> 00:02:36.040
Będę uruchamiać klaster
przy użyciu języka SQL.

00:02:36.040 --> 00:02:41.420
Tutaj stworzyłem zewnętrzne
tabeli w tym formacie pliku.

00:02:41.420 --> 00:02:43.870
To jest coś, co
można zrobić za pomocą kreatora.

00:02:43.870 --> 00:02:45.250
Zamierzam tu pójść,

00:02:45.250 --> 00:02:46.930
utworzyć tabelę zewnętrzną z plików CSV.

00:02:46.930 --> 00:02:50.315
Następnie, które stworzyłoby to
tabeli zewnętrznej, z której korzystam.

00:02:50.315 --> 00:02:52.415
Ale w tym przypadku, mam
zrobić za pomocą kodu.

00:02:52.415 --> 00:02:56.500
Jeśli uderzyłem Run komórek,

00:02:56.500 --> 00:02:59.765
można zobaczyć, że jestem również za pomocą SQL

00:02:59.765 --> 00:03:03.625
dostęp do tych samych danych, które
Właśnie dostęp za pomocą Spark.

00:03:03.625 --> 00:03:07.410
Teraz te pliki są
zapisywane jako pliki IPYNB,

00:03:07.410 --> 00:03:10.970
które mogę następnie podzielić się z moim
kolegów i mogę uruchomić ponownie.

00:03:10.970 --> 00:03:14.465
Tak więc w przypadku, gdy
chciał uruchomić to dzisiaj,

00:03:14.465 --> 00:03:15.995
wysłać go do mojego kolegi,

00:03:15.995 --> 00:03:18.950
mogli go otworzyć
na ich natychmiastowe i

00:03:18.950 --> 00:03:20.480
dołączyć go do własnego klastra lub

00:03:20.480 --> 00:03:22.535
do tego samego klastra i uruchom go ponownie.

00:03:22.535 --> 00:03:24.800
Używamy również notebooków
na kilka innych sposobów.

00:03:24.800 --> 00:03:27.485
Tutaj mamy coś
zwane książki Jowisza.

00:03:27.485 --> 00:03:30.710
Jest to lista w zasadzie notebooki

00:03:30.710 --> 00:03:34.130
które zostały zebrane razem
w formacie strony rozdziału.

00:03:34.130 --> 00:03:37.775
Więc tutaj mamy SQL
Serwer ML usług kursu,

00:03:37.775 --> 00:03:40.985
który jest pokazywany przez notebooki.

00:03:40.985 --> 00:03:43.070
Mamy więc wszystkie
dokumentacji.

00:03:43.070 --> 00:03:46.445
Mamy przykłady kodu
tutaj, a następnie można,

00:03:46.445 --> 00:03:47.780
na końcu każdego rozdziału,

00:03:47.780 --> 00:03:49.730
albo uderzyć następny
, aby przejść do następnego

00:03:49.730 --> 00:03:52.400
jednego lub użyć tego rozdziału
przeglądarkę, aby ją odebrać.

00:03:52.400 --> 00:03:54.965
Mamy również
książka o supportowalności

00:03:54.965 --> 00:03:57.255
dla programu SQL Server 2019
Klastry Big Data.

00:03:57.255 --> 00:03:59.210
Gdybym Wychowałem
Pilot dowodzenia i wybierz

00:03:59.210 --> 00:04:01.160
tej książki Jupiter 2019 przewodnik,

00:04:01.160 --> 00:04:03.035
ów ' co ja używać wobec otworzyć ten w górze.

00:04:03.035 --> 00:04:05.960
W tym miejscu mamy wszystkie
informacje, które mogą

00:04:05.960 --> 00:04:08.885
potrzeby w celu wsparcia
nowego klastra Big Data,

00:04:08.885 --> 00:04:11.585
Wiele komend Kubernetes,
Informacje o klastrze.

00:04:11.585 --> 00:04:13.565
To jest coś, co można uruchomić,

00:04:13.565 --> 00:04:14.735
Możesz wysłać do kogoś innego,

00:04:14.735 --> 00:04:17.065
i można zapisać i
robić to, co chcesz z.

00:04:17.065 --> 00:04:21.140
Jesteśmy więc bardzo podekscytowani
Notebooki w usłudze Azure Data Studio.

00:04:21.140 --> 00:04:23.210
Naprawdę uważamy, że to
jest czymś, co będzie

00:04:23.210 --> 00:04:26.210
Bardzo przydatna dla naszej społeczności.

00:04:26.210 --> 00:04:28.040
Jesteśmy naprawdę zainteresowani
w ustaleniu, jak

00:04:28.040 --> 00:04:29.765
korzystasz z niego i
co chcesz od nas.

00:04:29.765 --> 00:04:32.800
Więc jeśli jesteś zainteresowany
dowiedzieć się więcej, przejdź do GitHub,

00:04:32.800 --> 00:04:34.610
Poszukaj usługi Azure Data Studio i

00:04:34.610 --> 00:04:37.120
można otworzyć funkcję
żądanie Inter bugs.

00:04:37.120 --> 00:04:39.470
To także miejsce, w którym
można pobrać zarówno

00:04:39.470 --> 00:04:51.991
stabilny i wewnętrznych dodatek.
Dziękuję bardzo za poświęcony czas.

00:04:51.991 --> 00:04:57.040
>> [MUZYKA]

