WEBVTT

00:00:00.000 --> 00:00:10.530
[MUSICA].

00:00:10.530 --> 00:00:12.300
>> Ciao, sono Rony Chatterjee,

00:00:12.300 --> 00:00:15.180
Sono un Senior Product Manager
nel team di Azure Data.

00:00:15.180 --> 00:00:17.190
Lavoro sul prodotto SQL Server e

00:00:17.190 --> 00:00:19.605
oggi sono entusiasta di
mostrarvi quello che abbiamo

00:00:19.605 --> 00:00:22.230
costruito come un dato
esperienza di visualizzazione

00:00:22.230 --> 00:00:25.410
in Azure Data Studio.
Iniziamo.

00:00:25.410 --> 00:00:27.690
In Azure Data Studio,

00:00:27.690 --> 00:00:31.965
si dispone di un prodotto che ti dà

00:00:31.965 --> 00:00:33.960
una visualizzazione dei dati e un

00:00:33.960 --> 00:00:36.600
esperto di lavorare
sui dati ovunque,

00:00:36.600 --> 00:00:38.970
se si tratta di dati in locale e

00:00:38.970 --> 00:00:41.755
come dati all'interno dei cluster di Big Data.

00:00:41.755 --> 00:00:45.470
Quindi, in questa aggiunta di Azure
Data Studio, come potete vedere,

00:00:45.470 --> 00:00:47.870
Ho un bordo del database SQL e

00:00:47.870 --> 00:00:51.080
ai Big Data di SQL Server
Cluster in cui sono collegato.

00:00:51.080 --> 00:00:56.075
Ora, in Azure Data Studio è
costruito sulla parte superiore delle estensioni.

00:00:56.075 --> 00:00:59.300
Quindi una delle cose con
Azure Data Studio offre

00:00:59.300 --> 00:01:00.830
la possibilità di installare

00:01:00.830 --> 00:01:03.830
qualsiasi estensione che si potrebbe
come per l'operazione sui dati.

00:01:03.830 --> 00:01:06.155
Quindi qui, una delle estensioni
che ci accingiamo a

00:01:06.155 --> 00:01:08.830
installare oggi si chiama SandDance.

00:01:08.830 --> 00:01:12.035
SandDance è un dato
l'esperienza di visualizzazione.

00:01:12.035 --> 00:01:15.050
Fornisce unità
visualizzazione per i dati

00:01:15.050 --> 00:01:18.365
che si desidera esplorare
e visualizzare in SandDance.

00:01:18.365 --> 00:01:21.515
Quindi qui sto installando
l'estensione SandDance,

00:01:21.515 --> 00:01:22.955
e come potete vedere,

00:01:22.955 --> 00:01:25.535
l'estensione SandDance
è stato appena installato.

00:01:25.535 --> 00:01:28.775
Quindi torniamo a
dove si trovano i dati.

00:01:28.775 --> 00:01:32.720
Quindi ho i dati all'interno del
Cluster di Big Data di SQL Server.

00:01:32.720 --> 00:01:35.585
Big Data di SQL Server
Cluster viene fornito con

00:01:35.585 --> 00:01:38.330
HDFS con il cluster di Big Data

00:01:38.330 --> 00:01:40.745
dove possiamo memorizzare
elevato volume di dati.

00:01:40.745 --> 00:01:44.510
Uno di questi dati che ho
memorizzati in HDFS per esempio

00:01:44.510 --> 00:01:48.695
di Big Data di SQL Server
Cluster è un demovote.tsv.

00:01:48.695 --> 00:01:51.755
Quindi ora diamo un'occhiata a
come si presenta questi dati.

00:01:51.755 --> 00:01:54.230
Quindi, se si fa un rapido
l'anteprima dei dati,

00:01:54.230 --> 00:01:58.040
i set di dati si aprono da HDFS,

00:01:58.040 --> 00:01:59.150
e come potete vedere,

00:01:59.150 --> 00:02:01.115
questo non è altro che i dati di voto.

00:02:01.115 --> 00:02:03.230
Ha i dati di voto
durante l'Obama,

00:02:03.230 --> 00:02:04.625
Romney lasso di tempo di

00:02:04.625 --> 00:02:07.160
elezioni che è accaduto
in tutti gli Stati Uniti.

00:02:07.160 --> 00:02:11.540
Ora, se devo elaborare questo
particolare set di dati e assegnarlo a

00:02:11.540 --> 00:02:15.925
i miei data scientist in realtà
senso dai dati,

00:02:15.925 --> 00:02:18.010
avrebbe dovuto effettivamente
costruire alcuni rapporti,

00:02:18.010 --> 00:02:19.265
e se usa

00:02:19.265 --> 00:02:22.330
libreria di visualizzazione dati
strutturale per visualizzarlo,

00:02:22.330 --> 00:02:24.845
o usa un po 'di codice

00:02:24.845 --> 00:02:27.695
per visualizzare effettivamente
l'aspetto dei dati.

00:02:27.695 --> 00:02:29.509
Ma in Azure Data Studio,

00:02:29.509 --> 00:02:33.170
abbiamo il nostro tasto destro del mouse
opzione di visualizzazione in SandDance.

00:02:33.170 --> 00:02:36.070
Diamo un'occhiata a come
questi dati assomigliano.

00:02:36.070 --> 00:02:39.705
Ora, si può vedere che
SandDance si sta caricando,

00:02:39.705 --> 00:02:42.525
e SandDance in realtà
auto capito che

00:02:42.525 --> 00:02:45.480
questi dati hanno latitudine,

00:02:45.480 --> 00:02:47.765
longitudine, e grafico a dispersione sarebbe

00:02:47.765 --> 00:02:51.140
il miglior grafico per cui scegliere
tracciando questi dati particolari.

00:02:51.140 --> 00:02:55.610
Quindi abbiamo un grafico consigliato
tipo costruito all'interno di SandDance.

00:02:55.610 --> 00:02:57.395
Così ora questi dati sembrano buoni.

00:02:57.395 --> 00:02:59.300
Posso vedere che la mappa
degli Stati Uniti,

00:02:59.300 --> 00:03:01.040
come previsto perché i dati di voto,

00:03:01.040 --> 00:03:03.590
e hanno l'asse x e
anche sull'asse y.

00:03:03.590 --> 00:03:07.640
Ora, ancora non so se ci sono

00:03:07.640 --> 00:03:10.220
ulteriori informazioni in
i dati e ho potuto

00:03:10.220 --> 00:03:13.760
ovviamente filtro in termini di
l'asse x e l'asse y,

00:03:13.760 --> 00:03:16.760
ma non sarebbe bello se io
potrebbe effettivamente tracciare questo in

00:03:16.760 --> 00:03:19.085
uno spazio tridimensionale per

00:03:19.085 --> 00:03:21.935
vedere quale potrebbe essere
il miglior classificatore.

00:03:21.935 --> 00:03:26.085
Quindi facciamo questo grafico
tridimensionale.

00:03:26.085 --> 00:03:28.620
Quindi, se clicchi su "SandDance" e se

00:03:28.620 --> 00:03:31.575
fare clic sul pulsante "Tridimensionale
uno", ora ho l'asse z.

00:03:31.575 --> 00:03:35.840
Ora nell'asse z posso
scegliere il reddito e vedere

00:03:35.840 --> 00:03:38.015
in tutti gli Stati Uniti ciò che

00:03:38.015 --> 00:03:40.715
i dati demografici del reddito
della gente sono.

00:03:40.715 --> 00:03:42.740
Si può vedere che
Washington sta facendo del bene,

00:03:42.740 --> 00:03:44.855
Delaware sta andando un po 'meglio,

00:03:44.855 --> 00:03:47.960
e poi a New York e
Anche Miami è fantastica.

00:03:47.960 --> 00:03:49.760
Ma diamo un'occhiata,

00:03:49.760 --> 00:03:51.725
in termini di valore domestico mediano,

00:03:51.725 --> 00:03:53.180
come stanno i prezzi?

00:03:53.180 --> 00:03:56.840
Potete vedere che il grafico
regolato automaticamente.

00:03:56.840 --> 00:04:02.045
Si potrebbe anche avere un varie
schemi di colore che è possibile utilizzare.

00:04:02.045 --> 00:04:04.580
Così ho potuto effettivamente vedere, reddito,

00:04:04.580 --> 00:04:06.230
e si può vedere che posso scegliere

00:04:06.230 --> 00:04:09.380
schemi di colore diversi da
effettivamente colorare il grafico.

00:04:09.380 --> 00:04:13.325
Potrei anche facilmente
modificare la dimensione del numero di contenitori.

00:04:13.325 --> 00:04:17.030
Così si può vedere che come
Cambio il numero di bidoni,

00:04:17.030 --> 00:04:20.380
il grafico in modo dinamico
cambia completamente.

00:04:20.380 --> 00:04:22.130
Ora questo è buono.

00:04:22.130 --> 00:04:24.865
Posso anche visualizzare i dati,

00:04:24.865 --> 00:04:27.850
zoom avanti, zoom indietro, ma ora,

00:04:27.850 --> 00:04:32.440
Vorrei vedere se i dati
set mi sta dando un modo di

00:04:32.440 --> 00:04:34.165
dove ho potuto prevedere

00:04:34.165 --> 00:04:37.445
alcune anomalie se questo
esiste all'interno dei dati.

00:04:37.445 --> 00:04:40.880
Quindi ora, cominciamo facendo
una ricerca sopra i dati.

00:04:40.880 --> 00:04:46.455
Quindi ho intenzione di cercare
dove il reddito è inferiore a,

00:04:46.455 --> 00:04:52.829
diciamo 40.000 dollari, e anche
aggiungere un'altra espressione,

00:04:52.829 --> 00:04:59.675
e dire, valore domestico mediano
è maggiore di 800.000 dollari.

00:04:59.675 --> 00:05:02.205
Sembra un buon assegno.

00:05:02.205 --> 00:05:04.230
Vediamo se riusciamo a trovare
alcuni set di dati che

00:05:04.230 --> 00:05:06.975
in realtà soddisfa questa necessità.

00:05:06.975 --> 00:05:10.170
Ora, se lo faccio davvero
una ricerca e selezionare,

00:05:10.170 --> 00:05:12.260
si può vedere che
SandDance ha un paio di

00:05:12.260 --> 00:05:14.660
punti dati che
in realtà lo raccolse.

00:05:14.660 --> 00:05:17.210
Questi sono mostrati nel grafico.

00:05:17.210 --> 00:05:20.080
Potrei facilmente isolare
questi punti dati,

00:05:20.080 --> 00:05:21.860
e ora ho solo

00:05:21.860 --> 00:05:24.275
un sottoinsieme di questi quattro
punti dati da considerare.

00:05:24.275 --> 00:05:26.570
Si può vedere che c'è una persona in

00:05:26.570 --> 00:05:29.825
Contea di San Miguel che
ha comprato una casa di

00:05:29.825 --> 00:05:35.710
812.500 euro con un reddito di 39.070 euro.

00:05:35.710 --> 00:05:39.830
Così SandDance in realtà dare
si unità di visualizzazione di

00:05:39.830 --> 00:05:43.985
i dati che si sta cercando di esplorare
e dare un senso ai dati.

00:05:43.985 --> 00:05:46.220
Potresti anche fare altre cose

00:05:46.220 --> 00:05:49.440
come dove si potrebbe prendere
un'istantanea dell'immagine,

00:05:49.440 --> 00:05:51.150
si desidera creare una vista istantanea,

00:05:51.150 --> 00:05:53.919
si potrebbe effettivamente creare un'istantanea,

00:05:56.720 --> 00:05:59.690
e crea una vista istantanea.

00:05:59.690 --> 00:06:02.630
Ora è possibile incorporare questo
visualizzazione snapshot in un documento

00:06:02.630 --> 00:06:04.160
che si desidera
probabilmente inviarlo a

00:06:04.160 --> 00:06:05.945
qualcun altro di prendere
uno sguardo pure.

00:06:05.945 --> 00:06:08.330
Quindi questo è il modo in cui forniamo

00:06:08.330 --> 00:06:10.400
visualizzazione dei dati nel contesto

00:06:10.400 --> 00:06:12.635
dati in cui si sta operando.

00:06:12.635 --> 00:06:16.880
Ora, anche uno dei
cose che abbiamo aggiunto

00:06:16.880 --> 00:06:22.925
all'interno SandDance era l'abilità
per visualizzare i risultati della query.

00:06:22.925 --> 00:06:26.060
Così qui ho un
database che ho creato,

00:06:26.060 --> 00:06:30.020
e in questo particolare database
Ho una tabella dati sensore.

00:06:30.020 --> 00:06:32.840
Quindi ora se seleziono un 1.000

00:06:32.840 --> 00:06:35.705
da quel particolare
tavolo e ho potuto

00:06:35.705 --> 00:06:38.135
anche cliccare su questo grafico

00:06:38.135 --> 00:06:41.839
qui e caricare questi dati in
SandDance come visualizzatore,

00:06:41.839 --> 00:06:44.495
anche se questo è solo il sensore
dati e non ha

00:06:44.495 --> 00:06:47.210
interessante come il
i dati di voto sono, ma ancora,

00:06:47.210 --> 00:06:50.360
questo ti dà una rapida visione di ciò che

00:06:50.360 --> 00:06:54.655
la visualizzazione dei dati nel
contesto della query potrebbe essere come.

00:06:54.655 --> 00:06:57.025
Ora, in questo particolare video,

00:06:57.025 --> 00:07:00.035
avete visto come siamo
utilizzando SandDance per effettivamente

00:07:00.035 --> 00:07:03.665
visualizzare rapidamente i dati e fare

00:07:03.665 --> 00:07:05.705
tendenze significative e capire

00:07:05.705 --> 00:07:07.190
ciò che le tendenze stanno accadendo da

00:07:07.190 --> 00:07:09.140
i dati in modo che possa aiutare in

00:07:09.140 --> 00:07:11.435
costruzione di macchine avanzate
algoritmi di apprendimento.

00:07:11.435 --> 00:07:13.100
Grazie mille per
l'ascolto di oggi.

00:07:13.100 --> 00:07:27.910
[MUSICA].

