WEBVTT

00:00:00.000 --> 00:00:10.530
[MUZYKA].

00:00:10.530 --> 00:00:12.300
>> Cześć, jestem Rony Chatterjee,

00:00:12.300 --> 00:00:15.180
Jestem starszym menedżerem produktów
w zespole usługi Azure Data.

00:00:15.180 --> 00:00:17.190
Pracuję na produkcie SQL Server i

00:00:17.190 --> 00:00:19.605
Dziś jestem podekscytowany, aby
pokazać, co mamy

00:00:19.605 --> 00:00:22.230
zbudowany jako dane
doświadczenie wizualizacji

00:00:22.230 --> 00:00:25.410
w usłudze Azure Data Studio.
Zaczynajmy.

00:00:25.410 --> 00:00:27.690
W usłudze Azure Data Studio

00:00:27.690 --> 00:00:31.965
masz produkt, który daje Ci

00:00:31.965 --> 00:00:33.960
wizualizację danych, a także

00:00:33.960 --> 00:00:36.600
doświadczenie w pracy
nad danymi w dowolnym miejscu,

00:00:36.600 --> 00:00:38.970
Czy jest to dane lokalne, czy też

00:00:38.970 --> 00:00:41.755
danych wewnątrz klastrów Big Data.

00:00:41.755 --> 00:00:45.470
Tak więc w tym dodaniu platformy Azure
Data Studio, jak widać,

00:00:45.470 --> 00:00:47.870
Mam krawędź bazy danych SQL i

00:00:47.870 --> 00:00:51.080
SQL Server Big Data
Klaster, z którym jestem połączony.

00:00:51.080 --> 00:00:56.075
Teraz w usłudze Azure Data Studio jest
zbudowany na szczycie rozszerzeń.

00:00:56.075 --> 00:00:59.300
Więc jedna z rzeczy z
Usługa Azure Data Studio udostępnia

00:00:59.300 --> 00:01:00.830
możliwość zainstalowania

00:01:00.830 --> 00:01:03.830
Każde rozszerzenie, które może
jak w przypadku operacji danych.

00:01:03.830 --> 00:01:06.155
Więc tutaj, jeden z rozszerzeń
które mamy zamiar

00:01:06.155 --> 00:01:08.830
zainstalować dzisiaj nazywa się SandDance.

00:01:08.830 --> 00:01:12.035
SandDance to dane
wizualizacji.

00:01:12.035 --> 00:01:15.050
Zapewnia
Wizualizacja danych

00:01:15.050 --> 00:01:18.365
chcesz poznać
i wizualizować w SandDance.

00:01:18.365 --> 00:01:21.515
Więc tutaj jestem instalacji
rozszerzenia SandDance,

00:01:21.515 --> 00:01:22.955
i jak widać,

00:01:22.955 --> 00:01:25.535
rozszerzenie SandDance
został właśnie zainstalowany.

00:01:25.535 --> 00:01:28.775
Więc Wróćmy do
gdzie dane są.

00:01:28.775 --> 00:01:32.720
Więc mam dane wewnątrz
Klaster dużych zbiorów danych programu SQL Server.

00:01:32.720 --> 00:01:35.585
Dane Big Data programu SQL Server
Klaster jest dostarczany z

00:01:35.585 --> 00:01:38.330
HDFS z klastrem Big Data

00:01:38.330 --> 00:01:40.745
gdzie możemy przechowywać
dużej ilości danych.

00:01:40.745 --> 00:01:44.510
Jedno z takich danych, które mam
przechowywane w systemie HDFS na przykład

00:01:44.510 --> 00:01:48.695
programu SQL Server Big Data
Klaster jest demovote. tsv.

00:01:48.695 --> 00:01:51.755
Więc teraz Spójrzmy na
jak te dane wyglądają.

00:01:51.755 --> 00:01:54.230
Więc jeśli robisz szybkie
Podgląd danych,

00:01:54.230 --> 00:01:58.040
zestawy danych są otwierane z systemu HDFS,

00:01:58.040 --> 00:01:59.150
i jak widać,

00:01:59.150 --> 00:02:01.115
to nic innego jak głosowanie danych.

00:02:01.115 --> 00:02:03.230
Posiada dane do głosowania
podczas Obama,

00:02:03.230 --> 00:02:04.625
Romney ramy czasowe

00:02:04.625 --> 00:02:07.160
Wybory, które miały miejsce
w Stanach Zjednoczonych.

00:02:07.160 --> 00:02:11.540
Teraz, jeśli mam do przetworzenia tego
określonych danych i nadać mu

00:02:11.540 --> 00:02:15.925
moich danych naukowców faktycznie
sensu od danych,

00:02:15.925 --> 00:02:18.010
musiałby faktycznie
Tworzenie niektórych raportów,

00:02:18.010 --> 00:02:19.265
i czy używa

00:02:19.265 --> 00:02:22.330
Biblioteka wizualizacji danych
strukturalne, aby go zobaczyć,

00:02:22.330 --> 00:02:24.845
lub używa kodu

00:02:24.845 --> 00:02:27.695
do faktycznego wizualizacji
Jak wyglądają dane.

00:02:27.695 --> 00:02:29.509
Ale w usłudze Azure Data Studio

00:02:29.509 --> 00:02:33.170
mamy nasze kliknięcie prawym przyciskiem myszy
opcji widoku w SandDance.

00:02:33.170 --> 00:02:36.070
Spójrzmy na to, jak
takie dane wyglądają.

00:02:36.070 --> 00:02:39.705
Teraz widać, że
SandDance ładuje się,

00:02:39.705 --> 00:02:42.525
i SandDance faktycznie
Auto zorientowali się, że

00:02:42.525 --> 00:02:45.480
dane te mają szerokość geograficzną,

00:02:45.480 --> 00:02:47.765
długości geograficznej i wykres punktowy

00:02:47.765 --> 00:02:51.140
najlepszy wykres do wyboru
kreślenia tych konkretnych danych.

00:02:51.140 --> 00:02:55.610
Więc mamy wykres rekomendacyjny
Typ zbudowany wewnątrz SandDance.

00:02:55.610 --> 00:02:57.395
Więc teraz te dane wyglądają dobrze.

00:02:57.395 --> 00:02:59.300
Widzę, że mapa
Stanów Zjednoczonych,

00:02:59.300 --> 00:03:01.040
zgodnie z oczekiwaniami, ponieważ dane

00:03:01.040 --> 00:03:03.590
i mają osi x i
również na osi y.

00:03:03.590 --> 00:03:07.640
Teraz, nadal nie wiem, czy są

00:03:07.640 --> 00:03:10.220
Więcej informacji w
danych i mogłem

00:03:10.220 --> 00:03:13.760
Oczywiście filtr pod względem
osi x i osi y,

00:03:13.760 --> 00:03:16.760
ale nie byłoby wspaniale, gdybym
może rzeczywiście działki to w

00:03:16.760 --> 00:03:19.085
przestrzeni trójwymiarowej, aby faktycznie

00:03:19.085 --> 00:03:21.935
zobaczyć, który z nich może być
najlepszego klasyfikatora.

00:03:21.935 --> 00:03:26.085
Więc spójrzmy na ten wykres
trójwymiarowym.

00:03:26.085 --> 00:03:28.620
Więc jeśli klikam na "SandDance" i jeśli

00:03:28.620 --> 00:03:31.575
Kliknij przycisk "trójwymiarowy
jeden, "teraz mam oś z.

00:03:31.575 --> 00:03:35.840
Teraz w osi z mogę
Wybierz dochód i zobacz

00:03:35.840 --> 00:03:38.015
w Stanach Zjednoczonych, co

00:03:38.015 --> 00:03:40.715
demograficznych dochodów
ludzi.

00:03:40.715 --> 00:03:42.740
Widać, że
Waszyngton robi dobro,

00:03:42.740 --> 00:03:44.855
Delaware robi trochę lepiej,

00:03:44.855 --> 00:03:47.960
a następnie w Nowym Jorku i
Miami jest wielki, jak również.

00:03:47.960 --> 00:03:49.760
Ale spójrzmy na,

00:03:49.760 --> 00:03:51.725
w odniesieniu do mediany wartości macierzystej,

00:03:51.725 --> 00:03:53.180
jak są ceny patrząc?

00:03:53.180 --> 00:03:56.840
Widać, że wykres
automatycznie dostosowuje się.

00:03:56.840 --> 00:04:02.045
Można również mieć różne
schematów kolorów, których można użyć.

00:04:02.045 --> 00:04:04.580
Więc mogłem rzeczywiście zobaczyć, dochód,

00:04:04.580 --> 00:04:06.230
i widać, że mogę wybrać

00:04:06.230 --> 00:04:09.380
różne schematy kolorów, aby
faktycznie pokolorować wykres.

00:04:09.380 --> 00:04:13.325
Mógłbym również łatwo
zmienić rozmiar bincount.

00:04:13.325 --> 00:04:17.030
Więc można zobaczyć, że jak
Zmieniam bincount,

00:04:17.030 --> 00:04:20.380
wykres dynamicznie
po prostu zmienia się całkowicie.

00:04:20.380 --> 00:04:22.130
Teraz to jest dobre.

00:04:22.130 --> 00:04:24.865
Mogę również wizualizować dane,

00:04:24.865 --> 00:04:27.850
powiększyć, pomniejszyć, ale teraz,

00:04:27.850 --> 00:04:32.440
Chciałbym sprawdzić, czy dane
zestaw daje mi jakiś sposób

00:04:32.440 --> 00:04:34.165
gdzie mógłbym przewidzieć

00:04:34.165 --> 00:04:37.445
niektórych anomalii, jeśli
istnieje wewnątrz danych.

00:04:37.445 --> 00:04:40.880
Więc teraz Zacznijmy od robienia
Niektóre wyszukiwania na górze danych.

00:04:40.880 --> 00:04:46.455
Więc idę do wyszukiwania
gdzie dochód jest mniejszy,

00:04:46.455 --> 00:04:52.829
powiedzieć $40 000, a także
dodać kolejne wyrażenie,

00:04:52.829 --> 00:04:59.675
i powiedzieć, mediana wartości domu
jest większa niż $800 000.

00:04:59.675 --> 00:05:02.205
To wydaje się być dobrym sprawdzam.

00:05:02.205 --> 00:05:04.230
Zobaczmy, czy możemy znaleźć
zestaw danych, który

00:05:04.230 --> 00:05:06.975
faktycznie spełnia te potrzeby.

00:05:06.975 --> 00:05:10.170
Teraz, jeśli faktycznie
Wyszukiwanie i wybieranie,

00:05:10.170 --> 00:05:12.260
widać, że
SandDance ma kilka

00:05:12.260 --> 00:05:14.660
punktów danych, które
faktycznie podniósł go.

00:05:14.660 --> 00:05:17.210
Są one pokazane na wykresie.

00:05:17.210 --> 00:05:20.080
Mógłbym łatwo odizolować
tych punktów danych,

00:05:20.080 --> 00:05:21.860
i teraz po prostu mam

00:05:21.860 --> 00:05:24.275
podzbiorem tych czterech
punktów danych do rozważenia.

00:05:24.275 --> 00:05:26.570
Widać, że istnieje osoba w

00:05:26.570 --> 00:05:29.825
Hrabstwo San Miguel, które
kupił dom

00:05:29.825 --> 00:05:35.710
$812 500 z dochodem $39 070.

00:05:35.710 --> 00:05:39.830
Więc SandDance rzeczywiście dać
wizualizację jednostek

00:05:39.830 --> 00:05:43.985
danych, które próbujesz zbadać
i sensu z danych.

00:05:43.985 --> 00:05:46.220
Można również zrobić inne rzeczy

00:05:46.220 --> 00:05:49.440
jak gdzie można wziąć
migawkę obrazu,

00:05:49.440 --> 00:05:51.150
chcesz utworzyć widok migawki,

00:05:51.150 --> 00:05:53.919
faktycznie można utworzyć migawkę,

00:05:56.720 --> 00:05:59.690
i tworzy widok migawki.

00:05:59.690 --> 00:06:02.630
Teraz możesz osadzić Tę
Widok migawki w dokumencie

00:06:02.630 --> 00:06:04.160
którego chcesz
prawdopodobnie wysłać go do

00:06:04.160 --> 00:06:05.945
kogoś innego do podjęcia
przyjrzeć się również.

00:06:05.945 --> 00:06:08.330
Tak więc jest to sposób, w jaki zapewniamy

00:06:08.330 --> 00:06:10.400
Wizualizacja danych w kontekście

00:06:10.400 --> 00:06:12.635
dane, które użytkownik działa.

00:06:12.635 --> 00:06:16.880
Teraz również jeden z
rzeczy, które Dodaliśmy

00:06:16.880 --> 00:06:22.925
wewnątrz SandDance była umiejętność
do wizualizacji wyników zapytania.

00:06:22.925 --> 00:06:26.060
Więc mam
utworzonej przeze mnie bazy danych,

00:06:26.060 --> 00:06:30.020
i w tej konkretnej bazie danych
Mam tabelę danych czujnika.

00:06:30.020 --> 00:06:32.840
Więc teraz, jeśli nie wybrać 1 000

00:06:32.840 --> 00:06:35.705
z tego szczególnego
tabeli i mogłem

00:06:35.705 --> 00:06:38.135
również kliknąć na ten wykres

00:06:38.135 --> 00:06:41.839
i załadować te dane w
SandDance jako wizualizator,

00:06:41.839 --> 00:06:44.495
Choć jest to tylko czujnik
danych i nie ma on

00:06:44.495 --> 00:06:47.210
równie interesujące jak
dane do głosowania są nadal,

00:06:47.210 --> 00:06:50.360
to daje szybki podgląd tego, co

00:06:50.360 --> 00:06:54.655
wizualizacji danych w
może być podobny kontekst zapytania.

00:06:54.655 --> 00:06:57.025
Teraz w tym konkretnym filmie,

00:06:57.025 --> 00:07:00.035
widziałeś, jak jesteśmy
za pomocą SandDance faktycznie

00:07:00.035 --> 00:07:03.665
szybko wizualizować dane i wprowadzać

00:07:03.665 --> 00:07:05.705
sensownych trendów i zrozumienia

00:07:05.705 --> 00:07:07.190
Jakie tendencje zachodzą z

00:07:07.190 --> 00:07:09.140
danych, dzięki czemu może pomóc

00:07:09.140 --> 00:07:11.435
Budowanie zaawansowanej maszyny
algorytmów uczenia się.

00:07:11.435 --> 00:07:13.100
Dziękuję bardzo za
słuchania w dzisiejszych czasach.

00:07:13.100 --> 00:07:27.910
[MUZYKA].

