WEBVTT

00:00:00.000 --> 00:00:10.530
[HUDBA].

00:00:10.530 --> 00:00:12.300
>> Ahoj, jsem Rony Chatterjee,

00:00:12.300 --> 00:00:15.180
Jsem senior manažer produktů
v Azure datovém týmu.

00:00:15.180 --> 00:00:17.190
Pracuji na produktu SQL Server a

00:00:17.190 --> 00:00:19.605
Dnes jsem nadšená
Ukázat vám, co máme

00:00:19.605 --> 00:00:22.230
sestavené jako data
zkušenost s vizualizací

00:00:22.230 --> 00:00:25.410
v Azure Data Studio.
Začneme.

00:00:25.410 --> 00:00:27.690
V Azure Data Studio

00:00:27.690 --> 00:00:31.965
máte produkt, který vám dává

00:00:31.965 --> 00:00:33.960
vizualizaci dat i

00:00:33.960 --> 00:00:36.600
zkušená práce
přes data kdekoli,

00:00:36.600 --> 00:00:38.970
zda se jedná o data v prostorách a také

00:00:38.970 --> 00:00:41.755
jako data v rámci clusterů velkých dat.

00:00:41.755 --> 00:00:45.470
Takže v tomto přídavku Azure
Data Studio, jak můžete vidět,

00:00:45.470 --> 00:00:47.870
Mám výhodu databáze SQL a

00:00:47.870 --> 00:00:51.080
Velké údaje serveru SQL Server
Cluster, do kterého jsem připojen.

00:00:51.080 --> 00:00:56.075
V Azure Data Studio je nyní
postavený na příponách.

00:00:56.075 --> 00:00:59.300
Takže jedna z věcí s
V Azure Data Studio najdete

00:00:59.300 --> 00:01:00.830
možnost instalace

00:01:00.830 --> 00:01:03.830
rozšíření, které může
jako pro datovou operaci.

00:01:03.830 --> 00:01:06.155
Tak, jedno z prodloužení
které budeme

00:01:06.155 --> 00:01:08.830
dnešní instalace se nazývá SandDance.

00:01:08.830 --> 00:01:12.035
SandDance je datová
zkušenost s vizualizací.

00:01:12.035 --> 00:01:15.050
Poskytuje jednotkové
vizualizace dat

00:01:15.050 --> 00:01:18.365
Chcete prozkoumat
a představ si v SandDance.

00:01:18.365 --> 00:01:21.515
A tak sem Instaluji
rozšíření SandDance,

00:01:21.515 --> 00:01:22.955
a jak můžete vidět,

00:01:22.955 --> 00:01:25.535
rozšíření SandDance
byl právě nainstalován.

00:01:25.535 --> 00:01:28.775
Tak pojďme zpátky do
kde jsou data.

00:01:28.775 --> 00:01:32.720
Takže mám data uvnitř
Velký datový cluster serveru SQL Server.

00:01:32.720 --> 00:01:35.585
Velká data serveru SQL Server
Cluster je dodáván s

00:01:35.585 --> 00:01:38.330
HDFS s velkým datovým clusterem

00:01:38.330 --> 00:01:40.745
kde můžeme uložit
velký objem dat.

00:01:40.745 --> 00:01:44.510
Jedna taková data, která mám
Uloženo v systému souborů HDFS, například

00:01:44.510 --> 00:01:48.695
Velkých dat serveru SQL Server
Cluster je demovote. TSV.

00:01:48.695 --> 00:01:51.755
Takže teď se podíváme na
jak tato data vypadají.

00:01:51.755 --> 00:01:54.230
Takže když se rychle
Náhled dat,

00:01:54.230 --> 00:01:58.040
datové sady se otevírají z HDFS,

00:01:58.040 --> 00:01:59.150
a jak můžete vidět,

00:01:59.150 --> 00:02:01.115
to není nic jiného než hlasovací data.

00:02:01.115 --> 00:02:03.230
Má hlasovací data
během Obamovy

00:02:03.230 --> 00:02:04.625
Romneyho časový rámec

00:02:04.625 --> 00:02:07.160
volby, které se staly
ve Spojených státech.

00:02:07.160 --> 00:02:11.540
Teď, když to budu muset zpracovat
konkrétní soubor dat a dává jej

00:02:11.540 --> 00:02:15.925
Moji vědci ve skutečnosti
nedává smysl z údajů,

00:02:15.925 --> 00:02:18.010
bude muset skutečně
sestavit některé sestavy,

00:02:18.010 --> 00:02:19.265
a zda používá

00:02:19.265 --> 00:02:22.330
Knihovna vizualizace dat
strukturálně ji zobrazit,

00:02:22.330 --> 00:02:24.845
nebo používá nějaký kód

00:02:24.845 --> 00:02:27.695
ve skutečnosti vizualizovat
jak vypadají data.

00:02:27.695 --> 00:02:29.509
Ale v Azure Data Studio

00:02:29.509 --> 00:02:33.170
Máme po klepnutí pravým tlačítkem myši
možnost zobrazení v SandDance.

00:02:33.170 --> 00:02:36.070
Podíváme se, jak
Tato data vypadají jako.

00:02:36.070 --> 00:02:39.705
Teď vidíte, že
SandDance se načítá,

00:02:39.705 --> 00:02:42.525
a SandDance ve skutečnosti
automaticky spočítal, že

00:02:42.525 --> 00:02:45.480
Tyto údaje mají zeměpisnou šířku,

00:02:45.480 --> 00:02:47.765
Zeměpisná délka a bodový graf by

00:02:47.765 --> 00:02:51.140
Nejlepší graf pro výběr
vykreslení těchto konkrétních dat.

00:02:51.140 --> 00:02:55.610
Takže máme doporučanový graf
typ postavený uvnitř SandDance.

00:02:55.610 --> 00:02:57.395
Takže ty údaje vypadají dobře.

00:02:57.395 --> 00:02:59.300
Vidím, že mapa
Spojených států amerických,

00:02:59.300 --> 00:03:01.040
podle očekávání, protože hlasovací data,

00:03:01.040 --> 00:03:03.590
a mít osu x a
osa y také.

00:03:03.590 --> 00:03:07.640
Ale pořád nevím, jestli jsou

00:03:07.640 --> 00:03:10.220
více informací
data a mohl bych

00:03:10.220 --> 00:03:13.760
zjevně filtr z hlediska
osa x a osa y,

00:03:13.760 --> 00:03:16.760
ale nebylo by skvělé, kdybych
by to ve skutečnosti mohlo vynést do

00:03:16.760 --> 00:03:19.085
trojrozměrný prostor ve skutečnosti

00:03:19.085 --> 00:03:21.935
zjistit, který z nich může být
Nejlepší třídění.

00:03:21.935 --> 00:03:26.085
Takže tento graf uděláme
trojrozměrný.

00:03:26.085 --> 00:03:28.620
Takže když kliku na "SandDance" a kdybych

00:03:28.620 --> 00:03:31.575
Klepněte na "trojrozměrný
jedna, "teď mám osu z.

00:03:31.575 --> 00:03:35.840
Nyní na ose z mohu
vybrat příjem a zobrazit

00:03:35.840 --> 00:03:38.015
ve Spojených státech, co

00:03:38.015 --> 00:03:40.715
demografie příjmů
lidí.

00:03:40.715 --> 00:03:42.740
Vidíte, že
Washington si vede dobře,

00:03:42.740 --> 00:03:44.855
Delaware se trochu zlepšuje,

00:03:44.855 --> 00:03:47.960
a pak v New Yorku a
Miami je také skvělý.

00:03:47.960 --> 00:03:49.760
Ale podíváme se na to,

00:03:49.760 --> 00:03:51.725
z hlediska střední hodnoty bydlení,

00:03:51.725 --> 00:03:53.180
Jak se ceny dívají?

00:03:53.180 --> 00:03:56.840
Je vidět, že graf
automaticky upraveno.

00:03:56.840 --> 00:04:02.045
Můžete mít také různé
schémata barev, která můžete použít.

00:04:02.045 --> 00:04:04.580
Takže jsem skutečně viděl, příjem,

00:04:04.580 --> 00:04:06.230
a můžete vidět, že si mohu vybrat

00:04:06.230 --> 00:04:09.380
různá schémata barev pro
skutečně obarvit graf.

00:04:09.380 --> 00:04:13.325
Mohl bych také snadno
změnit velikost bincount.

00:04:13.325 --> 00:04:17.030
Takže vidíte, že
Změnil jsem bincount,

00:04:17.030 --> 00:04:20.380
Graf dynamicky
jen se úplně změní.

00:04:20.380 --> 00:04:22.130
Teď je to dobré.

00:04:22.130 --> 00:04:24.865
Umím si představit i data,

00:04:24.865 --> 00:04:27.850
přiblížení, oddálení, ale nyní,

00:04:27.850 --> 00:04:32.440
Rád bych viděl, zda data
Set mi dává nějaký způsob

00:04:32.440 --> 00:04:34.165
kde bych mohl předpovědět

00:04:34.165 --> 00:04:37.445
Některé anomálie, pokud
uvnitř dat existuje.

00:04:37.445 --> 00:04:40.880
Takže teď začneme
Některé vyhledávání v horní části dat.

00:04:40.880 --> 00:04:46.455
Takže se chystám prohledat
kde je příjem nižší než,

00:04:46.455 --> 00:04:52.829
Řekněme $40 000 a také
přidat další výraz,

00:04:52.829 --> 00:04:59.675
a řekněme střední hodnota domů
je větší než $800 000.

00:04:59.675 --> 00:05:02.205
To vypadá na dobrý šek.

00:05:02.205 --> 00:05:04.230
Podíváme se, jestli najdeme
Některé množiny dat, které

00:05:04.230 --> 00:05:06.975
skutečně vyhovuje těmto potřebám.

00:05:06.975 --> 00:05:10.170
Teď, když opravdu
hledání a výběr,

00:05:10.170 --> 00:05:12.260
můžete vidět, že
SandDance má pár

00:05:12.260 --> 00:05:14.660
datové body, které
to vlastně zvedl.

00:05:14.660 --> 00:05:17.210
Ty jsou zobrazeny v grafu.

00:05:17.210 --> 00:05:20.080
Snadno bych mohl izolovat
Tyto datové body,

00:05:20.080 --> 00:05:21.860
a teď mám jen

00:05:21.860 --> 00:05:24.275
podmnožina těchto čtyř
datové body, které je třeba zvážit.

00:05:24.275 --> 00:05:26.570
Můžete vidět, že v

00:05:26.570 --> 00:05:29.825
Okres San Miguel, který
koupil si dům

00:05:29.825 --> 00:05:35.710
$812 500 s příjmem $39 070.

00:05:35.710 --> 00:05:39.830
Takže SandDance skutečně dává
Vaše jednotní vizualizace

00:05:39.830 --> 00:05:43.985
data, která se pokoušíte prozkoumat
a nedává smysl z dat.

00:05:43.985 --> 00:05:46.220
Můžete také dělat jiné věci

00:05:46.220 --> 00:05:49.440
jako kdybys mohl vzít
snímek obrázku,

00:05:49.440 --> 00:05:51.150
Chcete vytvořit zobrazení snímků,

00:05:51.150 --> 00:05:53.919
ve skutečnosti můžete vytvořit snímek,

00:05:56.720 --> 00:05:59.690
a vytvoří zobrazení snímku.

00:05:59.690 --> 00:06:02.630
Nyní můžete vložit tento
zobrazení snímků v dokumentu

00:06:02.630 --> 00:06:04.160
které chcete
pravděpodobně ji pošle do

00:06:04.160 --> 00:06:05.945
někoho jiného, kdo by vzal
a také pohled.

00:06:05.945 --> 00:06:08.330
Tak takhle to děláme

00:06:08.330 --> 00:06:10.400
vizualizace dat v kontextu

00:06:10.400 --> 00:06:12.635
data, ve kterých pracujete.

00:06:12.635 --> 00:06:16.880
Nyní, také jedna z
věci, které jsme přidali

00:06:16.880 --> 00:06:22.925
uvnitř SandDance byla schopnost
k vizualizaci výsledků dotazu.

00:06:22.925 --> 00:06:26.060
Takže tady mám
vytvořená databáze,

00:06:26.060 --> 00:06:30.020
a v této konkrétní databázi
Mám tabulku dat ze senzorů.

00:06:30.020 --> 00:06:32.840
Takže teď, když si vyberete 1 000

00:06:32.840 --> 00:06:35.705
z tohoto konkrétního
a mohl bych

00:06:35.705 --> 00:06:38.135
také klepnout na tento graf

00:06:38.135 --> 00:06:41.839
a načíst tato data do
SandDance jako vizualizér,

00:06:41.839 --> 00:06:44.495
i když je to jen senzor
data a nemá

00:06:44.495 --> 00:06:47.210
stejně zajímavý jako
hlasovací data jsou ale stále,

00:06:47.210 --> 00:06:50.360
získáte tak rychlý přehled o tom, co

00:06:50.360 --> 00:06:54.655
vizualizace dat v
kontext dotazu může být podobný.

00:06:54.655 --> 00:06:57.025
Nyní v tomto konkrétním videu,

00:06:57.025 --> 00:07:00.035
Viděli jste, jak jsme
použití SandDance ke skutečnému

00:07:00.035 --> 00:07:03.665
rychle vizualizovat data a vytvořit

00:07:03.665 --> 00:07:05.705
smysluplné trendy a pochopení

00:07:05.705 --> 00:07:07.190
Jak se trendy odehrují od

00:07:07.190 --> 00:07:09.140
data tak, aby vám mohla pomoci při

00:07:09.140 --> 00:07:11.435
vytvoření pokročilého počítače
Výukové algoritmy.

00:07:11.435 --> 00:07:13.100
Moc vám děkuji za
Dnes naslouchá.

00:07:13.100 --> 00:07:27.910
[HUDBA].

