WEBVTT

00:00:00.000 --> 00:00:10.530
[MÚSICA].

00:00:10.530 --> 00:00:12.300
>> Oi, eu sou Rony Chatterjee,

00:00:12.300 --> 00:00:15.180
Sou gerente sênior de produtos
na equipe de Dados Do Zure.

00:00:15.180 --> 00:00:17.190
Eu trabalho no produto do servidor SQL e

00:00:17.190 --> 00:00:19.605
hoje estou animado para
mostrar-lhe o que temos

00:00:19.605 --> 00:00:22.230
construído como um dado
experiência de visualização

00:00:22.230 --> 00:00:25.410
no Azure Data Studio.
Vamos começar.

00:00:25.410 --> 00:00:27.690
No Azure Data Studio,

00:00:27.690 --> 00:00:31.965
você tem um produto que lhe dá

00:00:31.965 --> 00:00:33.960
uma visualização de dados, bem como um

00:00:33.960 --> 00:00:36.600
experiente para trabalhar
sobre dados em qualquer lugar,

00:00:36.600 --> 00:00:38.970
se são dados no local também

00:00:38.970 --> 00:00:41.755
como dados dentro de clusters de big data.

00:00:41.755 --> 00:00:45.470
Assim, nesta adição de Azure
Data Studio, como você pode ver,

00:00:45.470 --> 00:00:47.870
Eu tenho uma borda da base de dados de SQL e

00:00:47.870 --> 00:00:51.080
um Big Data do servidor SQL
Cluster eu estou conectado.

00:00:51.080 --> 00:00:56.075
Agora, no Azure Data Studio é
construído em cima de extensões.

00:00:56.075 --> 00:00:59.300
Então, uma das coisas com
O Azure Data Studio fornece

00:00:59.300 --> 00:01:00.830
uma capacidade de instalar

00:01:00.830 --> 00:01:03.830
qualquer extensão que você possa
gosto de sua operação de dados.

00:01:03.830 --> 00:01:06.155
Então aqui, uma das extensões
que vamos

00:01:06.155 --> 00:01:08.830
instalar hoje é chamado SandDance.

00:01:08.830 --> 00:01:12.035
SandDance é um dado
experiência de visualização.

00:01:12.035 --> 00:01:15.050
Fornece a unidade
visualização dos dados

00:01:15.050 --> 00:01:18.365
você gostaria de explorar
e visualizar em SandDance.

00:01:18.365 --> 00:01:21.515
Então, aqui eu estou instalando
a extensão sanddance,

00:01:21.515 --> 00:01:22.955
e como você pode ver,

00:01:22.955 --> 00:01:25.535
a extensão sanddance
Foi instalado.

00:01:25.535 --> 00:01:28.775
Então, vamos voltar para
onde os dados estão.

00:01:28.775 --> 00:01:32.720
Então, eu tenho dados dentro do
Cluster de big data do servidor SQL.

00:01:32.720 --> 00:01:35.585
O Big Data do servidor SQL
Cluster vem com

00:01:35.585 --> 00:01:38.330
HDFS com o Cluster de Big Data

00:01:38.330 --> 00:01:40.745
onde podemos armazenar
alto volume de dados.

00:01:40.745 --> 00:01:44.510
Um desses dados que eu tenho
armazenados no HDFS, por exemplo

00:01:44.510 --> 00:01:48.695
de SQL Server Big Data
Cluster é um demovote.tsv.

00:01:48.695 --> 00:01:51.755
Então, agora vamos dar uma olhada
como esses dados se parecem.

00:01:51.755 --> 00:01:54.230
Então, se você fizer um rápido
visualização dos dados,

00:01:54.230 --> 00:01:58.040
os conjuntos de dados abertos a partir de HDFS,

00:01:58.040 --> 00:01:59.150
e como você pode ver,

00:01:59.150 --> 00:02:01.115
isto não é nada além de dados de votação.

00:02:01.115 --> 00:02:03.230
Tem os dados de votação
durante o Obama,

00:02:03.230 --> 00:02:04.625
Prazo de Romney de

00:02:04.625 --> 00:02:07.160
eleições que aconteceram
em todo os Estados Unidos.

00:02:07.160 --> 00:02:11.540
Agora, se eu tiver que processar isso
conjunto de dados específico e dá-lo

00:02:11.540 --> 00:02:15.925
meus cientistas de dados para realmente
faz sentido a partir dos dados,

00:02:15.925 --> 00:02:18.010
ele teria que realmente
construir alguns relatórios,

00:02:18.010 --> 00:02:19.265
e se ele usa

00:02:19.265 --> 00:02:22.330
Biblioteca de visualização de dados
estruturais para vê-lo,

00:02:22.330 --> 00:02:24.845
ou ele usa algum código

00:02:24.845 --> 00:02:27.695
para realmente visualizar
como são os dados.

00:02:27.695 --> 00:02:29.509
Mas no Estúdio de Dados Do Azure,

00:02:29.509 --> 00:02:33.170
temos o nosso clique direito
opção de exibição no SandDance.

00:02:33.170 --> 00:02:36.070
Vamos dar uma olhada em como
Esses dados se parecem.

00:02:36.070 --> 00:02:39.705
Agora, você pode ver isso
SandDance está carregando,

00:02:39.705 --> 00:02:42.525
e SandDance realmente
auto descobriu que

00:02:42.525 --> 00:02:45.480
estes dados têm latitude,

00:02:45.480 --> 00:02:47.765
longitude, e enredo dispersão seria

00:02:47.765 --> 00:02:51.140
o melhor gráfico para escolher
traçar esses dados específicos.

00:02:51.140 --> 00:02:55.610
Portanto, temos um gráfico de recomendação
tipo construído dentro da SandDance.

00:02:55.610 --> 00:02:57.395
Então, agora esses dados parecem bons.

00:02:57.395 --> 00:02:59.300
Eu posso ver que o mapa
dos Estados Unidos,

00:02:59.300 --> 00:03:01.040
como esperado porque os dados de votação,

00:03:01.040 --> 00:03:03.590
e ter o eixo x e
o eixo y também.

00:03:03.590 --> 00:03:07.640
Agora, ainda não sei se há

00:03:07.640 --> 00:03:10.220
mais informações em
os dados e eu poderia

00:03:10.220 --> 00:03:13.760
obviamente filtro em termos de
o eixo x e o eixo y,

00:03:13.760 --> 00:03:16.760
mas não seria ótimo se eu
poderia realmente traçar isso em

00:03:16.760 --> 00:03:19.085
um espaço tridimensional para realmente

00:03:19.085 --> 00:03:21.935
ver qual deles poderia ser
o melhor classificador.

00:03:21.935 --> 00:03:26.085
Então, vamos fazer este gráfico
um tridimensional.

00:03:26.085 --> 00:03:28.620
Então, se eu clicar em "SandDance" e se eu

00:03:28.620 --> 00:03:31.575
clique no "Tridimensional
um", agora eu tenho o eixo z.

00:03:31.575 --> 00:03:35.840
Agora, no eixo z eu posso
escolher renda e ver

00:03:35.840 --> 00:03:38.015
em todo os Estados Unidos o que

00:03:38.015 --> 00:03:40.715
a demografia dos rendimentos
das pessoas são.

00:03:40.715 --> 00:03:42.740
Você pode ver isso
Washington está indo bem.

00:03:42.740 --> 00:03:44.855
Delaware está indo um pouco melhor,

00:03:44.855 --> 00:03:47.960
e depois em Nova Iorque e depois em Nova Iorque e
Miami é ótima também.

00:03:47.960 --> 00:03:49.760
Mas vamos dar uma olhada,

00:03:49.760 --> 00:03:51.725
em termos do valor médio da casa,

00:03:51.725 --> 00:03:53.180
como os preços estão olhando?

00:03:53.180 --> 00:03:56.840
Você pode ver que o gráfico
automaticamente ajustado a si mesmo.

00:03:56.840 --> 00:04:02.045
Você também pode ter um vários
esquemas de cor que você pode usar.

00:04:02.045 --> 00:04:04.580
Então eu podia realmente ver, renda,

00:04:04.580 --> 00:04:06.230
e você pode ver que eu posso escolher

00:04:06.230 --> 00:04:09.380
esquemas de cores diferentes para
na verdade, colorir o gráfico.

00:04:09.380 --> 00:04:13.325
Eu também poderia facilmente
alterar o tamanho do bincount.

00:04:13.325 --> 00:04:17.030
Então você pode ver isso como
Eu mudo o bincount,

00:04:17.030 --> 00:04:20.380
o gráfico dinamicamente
apenas muda completamente.

00:04:20.380 --> 00:04:22.130
Agora isso é bom.

00:04:22.130 --> 00:04:24.865
Eu também posso visualizar os dados,

00:04:24.865 --> 00:04:27.850
zoom, zoom para fora, mas agora,

00:04:27.850 --> 00:04:32.440
Gostaria de ver se os dados
set está me dando alguma maneira de

00:04:32.440 --> 00:04:34.165
onde eu poderia prever

00:04:34.165 --> 00:04:37.445
algumas anomalias se isso
existe dentro dos dados.

00:04:37.445 --> 00:04:40.880
Então, agora, vamos começar por fazer
algumas pesquisas em cima dos dados.

00:04:40.880 --> 00:04:46.455
Então, eu vou procurar
onde a renda é menor do que,

00:04:46.455 --> 00:04:52.829
digamos $ 40.000, e também
adicionar outra expressão,

00:04:52.829 --> 00:04:59.675
e digamos, valor médio da casa
é superior a US $ 800.000.

00:04:59.675 --> 00:05:02.205
Isso parece ser um bom cheque.

00:05:02.205 --> 00:05:04.230
Vamos ver se podemos encontrar
alguns dados

00:05:04.230 --> 00:05:06.975
realmente satisfaz essas necessidades.

00:05:06.975 --> 00:05:10.170
Agora, se eu realmente fizer isso.
uma pesquisa e selecionar,

00:05:10.170 --> 00:05:12.260
você pode ver que
SandDance tem um par de

00:05:12.260 --> 00:05:14.660
dados aponta quais
na verdade, pegou.

00:05:14.660 --> 00:05:17.210
Esses são mostrados no gráfico.

00:05:17.210 --> 00:05:20.080
Eu poderia facilmente isolar
esses pontos de dados,

00:05:20.080 --> 00:05:21.860
e agora eu só tenho

00:05:21.860 --> 00:05:24.275
um subconjunto destes quatro
os dados apontam para considerar.

00:05:24.275 --> 00:05:26.570
Você pode ver que há uma pessoa em

00:05:26.570 --> 00:05:29.825
Condado de San Miguel, que
comprou uma casa de

00:05:29.825 --> 00:05:35.710
R$ 812.500 com renda de R$ 39.070.

00:05:35.710 --> 00:05:39.830
Então SandDance realmente dar
você unidade visualização de

00:05:39.830 --> 00:05:43.985
os dados que você está tentando explorar
e fazer sentido a partir dos dados.

00:05:43.985 --> 00:05:46.220
Você também pode fazer outras coisas

00:05:46.220 --> 00:05:49.440
como onde você poderia levar
um instantâneo da imagem,

00:05:49.440 --> 00:05:51.150
você quer criar uma visão instantânea,

00:05:51.150 --> 00:05:53.919
você poderia realmente criar um instantâneo,

00:05:56.720 --> 00:05:59.690
e cria uma visão instantânea.

00:05:59.690 --> 00:06:02.630
Agora você pode incorporar isso
visão instantânea em um documento

00:06:02.630 --> 00:06:04.160
que você quer
provavelmente enviá-lo para

00:06:04.160 --> 00:06:05.945
outra pessoa para levar
um olhar para também.

00:06:05.945 --> 00:06:08.330
Portanto, esta é a maneira que estamos fornecendo

00:06:08.330 --> 00:06:10.400
visualização de dados no contexto de

00:06:10.400 --> 00:06:12.635
os dados em que você está operando.

00:06:12.635 --> 00:06:16.880
Agora, também um dos
coisas que temos acrescentado

00:06:16.880 --> 00:06:22.925
dentro sanddance foi a capacidade
visualizar os resultados da consulta.

00:06:22.925 --> 00:06:26.060
Então, aqui eu tenho um
banco de dados que criei,

00:06:26.060 --> 00:06:30.020
e neste banco de dados em particular
Tenho uma tabela de dados de sensores.

00:06:30.020 --> 00:06:32.840
Então, agora, se eu selecionar um 1.000

00:06:32.840 --> 00:06:35.705
a partir desse particular
tabela e eu poderia

00:06:35.705 --> 00:06:38.135
também clique neste gráfico

00:06:38.135 --> 00:06:41.839
aqui e carregar esses dados em
a Dança de Areia como visualizador,

00:06:41.839 --> 00:06:44.495
embora este seja apenas o sensor
dados e não

00:06:44.495 --> 00:06:47.210
tão interessante quanto o
os dados de votação são, mas ainda assim,

00:06:47.210 --> 00:06:50.360
isso lhe dá uma visão rápida do que

00:06:50.360 --> 00:06:54.655
a visualização de dados no
contexto da consulta poderia ser como.

00:06:54.655 --> 00:06:57.025
Agora, neste vídeo em particular,

00:06:57.025 --> 00:07:00.035
você viu como estamos
usando SandDance para realmente

00:07:00.035 --> 00:07:03.665
visualizar rapidamente os dados e fazer

00:07:03.665 --> 00:07:05.705
tendências e compreensão significativos

00:07:05.705 --> 00:07:07.190
o que as tendências estão acontecendo a partir de

00:07:07.190 --> 00:07:09.140
os dados para que ele possa ajudá-lo em

00:07:09.140 --> 00:07:11.435
construção de máquina avançada
algoritmos de aprendizagem.

00:07:11.435 --> 00:07:13.100
Muito obrigado por
ouvindo hoje.

00:07:13.100 --> 00:07:27.910
[MÚSICA].

