WEBVTT

00:00:00.000 --> 00:00:10.530
[MUSIC].

00:00:10.530 --> 00:00:12.300
>> Hola, soy Rony Chatterjee,

00:00:12.300 --> 00:00:15.180
Soy Gerente Senior de Producto
en el equipo de Azure Data.

00:00:15.180 --> 00:00:17.190
Trabajo en el producto SQL Server y

00:00:17.190 --> 00:00:19.605
hoy estoy emocionado de
mostrarle lo que tenemos

00:00:19.605 --> 00:00:22.230
construido como un dato
experiencia de visualización

00:00:22.230 --> 00:00:25.410
en Azure Data Studio.
Empecemos.

00:00:25.410 --> 00:00:27.690
En Azure Data Studio,

00:00:27.690 --> 00:00:31.965
usted tiene un producto que le da

00:00:31.965 --> 00:00:33.960
una visualización de datos, así como una

00:00:33.960 --> 00:00:36.600
experiencia para trabajar
sobre datos en cualquier lugar,

00:00:36.600 --> 00:00:38.970
si se trata de datos locales, así

00:00:38.970 --> 00:00:41.755
como datos dentro de los clústeres de Big Data.

00:00:41.755 --> 00:00:45.470
Así que en esta adición de Azure
Data Studio, como pueden ver,

00:00:45.470 --> 00:00:47.870
Tengo un borde de base de datos SQL y

00:00:47.870 --> 00:00:51.080
un Big Data de SQL Server
Clúster en el que estoy conectado.

00:00:51.080 --> 00:00:56.075
Ahora, en Azure Data Studio es
construido sobre las extensiones.

00:00:56.075 --> 00:00:59.300
Así que una de las cosas con
Azure Data Studio proporciona es

00:00:59.300 --> 00:01:00.830
la capacidad de instalar

00:01:00.830 --> 00:01:03.830
cualquier extensión que usted podría
como para su operación de datos.

00:01:03.830 --> 00:01:06.155
Así que aquí, una de las extensiones
que vamos a

00:01:06.155 --> 00:01:08.830
instalar hoy se llama SandDance.

00:01:08.830 --> 00:01:12.035
SandDance es un dato
experiencia de visualización.

00:01:12.035 --> 00:01:15.050
Proporciona unidad
visualización de los datos

00:01:15.050 --> 00:01:18.365
le gustaría explorar
y visualizar en SandDance.

00:01:18.365 --> 00:01:21.515
Así que aquí estoy instalando
la extensión SandDance,

00:01:21.515 --> 00:01:22.955
y como pueden ver,

00:01:22.955 --> 00:01:25.535
la extensión SandDance
se acaba de instalar.

00:01:25.535 --> 00:01:28.775
Así que volvamos a
donde están los datos.

00:01:28.775 --> 00:01:32.720
Así que tengo datos dentro de la
Clúster de Big Data de SQL Server.

00:01:32.720 --> 00:01:35.585
El Big Data de SQL Server
El clúster viene con

00:01:35.585 --> 00:01:38.330
HDFS con el clúster de Big Data

00:01:38.330 --> 00:01:40.745
donde podemos almacenar
alto volumen de datos.

00:01:40.745 --> 00:01:44.510
Uno de esos datos que tengo
almacenado en HDFS, por ejemplo

00:01:44.510 --> 00:01:48.695
de BIG Data de SQL Server
Cluster es un demovote.tsv.

00:01:48.695 --> 00:01:51.755
Así que ahora vamos a echar un vistazo a
cómo se ven estos datos.

00:01:51.755 --> 00:01:54.230
Así que si usted hace un rápido
vista previa de los datos,

00:01:54.230 --> 00:01:58.040
los conjuntos de datos se abren desde HDFS,

00:01:58.040 --> 00:01:59.150
y como pueden ver,

00:01:59.150 --> 00:02:01.115
esto no es más que datos de votación.

00:02:01.115 --> 00:02:03.230
Tiene los datos de votación
durante el Obama,

00:02:03.230 --> 00:02:04.625
Romney marco de tiempo de

00:02:04.625 --> 00:02:07.160
elecciones que ocurrieron
en los Estados Unidos.

00:02:07.160 --> 00:02:11.540
Ahora, si tengo que procesar esto
conjunto de datos particular y darlo a

00:02:11.540 --> 00:02:15.925
mis científicos de datos a realmente
tienen sentido a partir de los datos,

00:02:15.925 --> 00:02:18.010
tendría que en realidad
construir algunos informes,

00:02:18.010 --> 00:02:19.265
y si utiliza

00:02:19.265 --> 00:02:22.330
biblioteca de visualización de datos
estructural para verlo,

00:02:22.330 --> 00:02:24.845
o usa algún código

00:02:24.845 --> 00:02:27.695
para visualizar realmente
cómo se ven los datos.

00:02:27.695 --> 00:02:29.509
Pero en Azure Data Studio,

00:02:29.509 --> 00:02:33.170
tenemos nuestro clic derecho
opción de vista en SandDance.

00:02:33.170 --> 00:02:36.070
Echemos un vistazo a cómo
estos datos parecen.

00:02:36.070 --> 00:02:39.705
Ahora, se puede ver que
SandDance se está cargando,

00:02:39.705 --> 00:02:42.525
y SandDance en realidad
auto descubrió que

00:02:42.525 --> 00:02:45.480
estos datos tienen latitud,

00:02:45.480 --> 00:02:47.765
longitud, y la gráfica de dispersión sería

00:02:47.765 --> 00:02:51.140
el mejor gráfico para elegir
trazando estos datos en particular.

00:02:51.140 --> 00:02:55.610
Así que tenemos un gráfico de recomendación
tipo construido dentro de SandDance.

00:02:55.610 --> 00:02:57.395
Así que ahora estos datos se ven bien.

00:02:57.395 --> 00:02:59.300
Puedo ver que el mapa
de los Estados Unidos,

00:02:59.300 --> 00:03:01.040
como se esperaba porque los datos de votación,

00:03:01.040 --> 00:03:03.590
y tienen el eje X y
el eje Y también.

00:03:03.590 --> 00:03:07.640
Ahora, todavía no sé si hay

00:03:07.640 --> 00:03:10.220
más información en
los datos y yo podría

00:03:10.220 --> 00:03:13.760
obviamente filtrar en términos de
el eje X y el eje Y,

00:03:13.760 --> 00:03:16.760
pero ¿no sería genial si
podría realmente trazar esto en

00:03:16.760 --> 00:03:19.085
un espacio tridimensional para

00:03:19.085 --> 00:03:21.935
ver cuál podría ser
el mejor clasificador.

00:03:21.935 --> 00:03:26.085
Así que vamos a hacer este gráfico
tridimensional.

00:03:26.085 --> 00:03:28.620
Así que si hago clic en "SandDance" y si

00:03:28.620 --> 00:03:31.575
haga clic en el "Tres dimensiones
uno", ahora tengo el eje z.

00:03:31.575 --> 00:03:35.840
Ahora en el eje z puedo
elegir los ingresos y ver

00:03:35.840 --> 00:03:38.015
en los Estados Unidos lo que

00:03:38.015 --> 00:03:40.715
la demografía de ingresos
de la gente lo son.

00:03:40.715 --> 00:03:42.740
Se puede ver que
Washington está haciendo el bien,

00:03:42.740 --> 00:03:44.855
Delaware lo está haciendo un poco mejor,

00:03:44.855 --> 00:03:47.960
y luego en Nueva York y
Miami también es genial.

00:03:47.960 --> 00:03:49.760
Pero echemos un vistazo,

00:03:49.760 --> 00:03:51.725
en términos de la mediana del valor de la vivienda,

00:03:51.725 --> 00:03:53.180
¿cómo se ven los precios?

00:03:53.180 --> 00:03:56.840
Se puede ver que el gráfico
automáticamente se ajustó.

00:03:56.840 --> 00:04:02.045
También podría tener varios
esquemas de color que puede utilizar.

00:04:02.045 --> 00:04:04.580
Así que en realidad pude ver.ingresos,

00:04:04.580 --> 00:04:06.230
y se puede ver que puedo elegir

00:04:06.230 --> 00:04:09.380
diferentes esquemas de color para
en realidad colorear el gráfico.

00:04:09.380 --> 00:04:13.325
También podría fácilmente
cambiar el tamaño del recuento.

00:04:13.325 --> 00:04:17.030
Así que se puede ver que como
Cambio el recuento,

00:04:17.030 --> 00:04:20.380
el gráfico dinámicamente
sólo cambia por completo.

00:04:20.380 --> 00:04:22.130
Esto es bueno.

00:04:22.130 --> 00:04:24.865
También puedo visualizar los datos,

00:04:24.865 --> 00:04:27.850
acercar, alejar, pero ahora,

00:04:27.850 --> 00:04:32.440
Me gustaría ver si los datos
conjunto me está dando alguna manera de

00:04:32.440 --> 00:04:34.165
donde podía predecir

00:04:34.165 --> 00:04:37.445
algunas anomalías si eso
existe dentro de los datos.

00:04:37.445 --> 00:04:40.880
Así que ahora, vamos a empezar por hacer
alguna búsqueda en la parte superior de los datos.

00:04:40.880 --> 00:04:46.455
Así que voy a buscar
donde los ingresos son menores que,

00:04:46.455 --> 00:04:52.829
decir $ 40,000, y también
añadir otra expresión,

00:04:52.829 --> 00:04:59.675
y decir, valor medio de la casa
es superior a $ 800.000.

00:04:59.675 --> 00:05:02.205
Parece ser un buen cheque.

00:05:02.205 --> 00:05:04.230
Veamos si podemos encontrar
algún conjunto de datos que

00:05:04.230 --> 00:05:06.975
realmente satisface estas necesidades.

00:05:06.975 --> 00:05:10.170
Ahora, si realmente lo hago
una búsqueda y selección,

00:05:10.170 --> 00:05:12.260
se puede ver que
SandDance tiene un par de

00:05:12.260 --> 00:05:14.660
puntos de datos que
en realidad lo recogió.

00:05:14.660 --> 00:05:17.210
Esos se muestran en el gráfico.

00:05:17.210 --> 00:05:20.080
Podría aislar fácilmente
estos puntos de datos,

00:05:20.080 --> 00:05:21.860
y ahora sólo tengo

00:05:21.860 --> 00:05:24.275
un subconjunto de estos cuatro
puntos de datos a tener en cuenta.

00:05:24.275 --> 00:05:26.570
Se puede ver que hay una persona en

00:05:26.570 --> 00:05:29.825
Condado de San Miguel que
ha comprado una casa de

00:05:29.825 --> 00:05:35.710
$ 812,500 con un ingreso de $ 39,070.

00:05:35.710 --> 00:05:39.830
Así que SandDance en realidad dar
que la visualización unitaria de

00:05:39.830 --> 00:05:43.985
los datos que está tratando de explorar
y tienen sentido a partir de los datos.

00:05:43.985 --> 00:05:46.220
También podrías hacer otras cosas

00:05:46.220 --> 00:05:49.440
como donde se puede tomar
una instantánea de la imagen,

00:05:49.440 --> 00:05:51.150
desea crear una vista de instantánea,

00:05:51.150 --> 00:05:53.919
en realidad se podría crear una instantánea,

00:05:56.720 --> 00:05:59.690
y crea una vista de instantánea.

00:05:59.690 --> 00:06:02.630
Ahora puede incrustar este
vista instantánea en un documento

00:06:02.630 --> 00:06:04.160
que desea
probablemente enviarlo a

00:06:04.160 --> 00:06:05.945
otra persona que tomar
una mirada también.

00:06:05.945 --> 00:06:08.330
Así que esta es la forma en que estamos proporcionando

00:06:08.330 --> 00:06:10.400
visualización de datos en el contexto de

00:06:10.400 --> 00:06:12.635
los datos en los que está operando.

00:06:12.635 --> 00:06:16.880
Ahora, también uno de los
cosas que hemos añadido

00:06:16.880 --> 00:06:22.925
dentro de SandDance era la capacidad
para visualizar los resultados de la consulta.

00:06:22.925 --> 00:06:26.060
Así que aquí tengo un
base de datos que he creado,

00:06:26.060 --> 00:06:30.020
y en esta base de datos en particular
Tengo una tabla de datos del sensor.

00:06:30.020 --> 00:06:32.840
Así que ahora si selecciono un 1,000

00:06:32.840 --> 00:06:35.705
de ese particular
mesa y yo podría

00:06:35.705 --> 00:06:38.135
también haga clic en este gráfico

00:06:38.135 --> 00:06:41.839
aquí y cargar estos datos en
el SandDance como visualizador,

00:06:41.839 --> 00:06:44.495
aunque esto es sólo el sensor
datos y no tiene

00:06:44.495 --> 00:06:47.210
tan interesante como el
los datos de votación no son más que,

00:06:47.210 --> 00:06:50.360
esto le da una visión rápida de lo que

00:06:50.360 --> 00:06:54.655
la visualización de datos en el
contexto de la consulta podría ser como.

00:06:54.655 --> 00:06:57.025
Ahora, en este video en particular,

00:06:57.025 --> 00:07:00.035
usted ha visto cómo estamos
usando SandDance para realmente

00:07:00.035 --> 00:07:03.665
visualizar rápidamente los datos y hacer

00:07:03.665 --> 00:07:05.705
tendencias significativas y entender

00:07:05.705 --> 00:07:07.190
lo que las tendencias están sucediendo de

00:07:07.190 --> 00:07:09.140
los datos para que puedan ayudarle en

00:07:09.140 --> 00:07:11.435
construcción de máquina avanzada
algoritmos de aprendizaje.

00:07:11.435 --> 00:07:13.100
Muchas gracias por
escuchando en el día de hoy.

00:07:13.100 --> 00:07:27.910
[MUSIC].

