WEBVTT

00:00:00.000 --> 00:00:10.530
[MUSIQUE].

00:00:10.530 --> 00:00:12.300
Salut, je suis Rony Chatterjee,

00:00:12.300 --> 00:00:15.180
Je suis chef de produit senior
dans l'équipe Azure Data.

00:00:15.180 --> 00:00:17.190
Je travaille sur le produit serveur SQL et

00:00:17.190 --> 00:00:19.605
aujourd'hui, je suis heureux de
vous montrer ce que nous avons

00:00:19.605 --> 00:00:22.230
construit comme une donnée
expérience de visualisation

00:00:22.230 --> 00:00:25.410
dans Azure Data Studio.
Commençons.

00:00:25.410 --> 00:00:27.690
Dans Azure Data Studio,

00:00:27.690 --> 00:00:31.965
vous avez un produit qui vous donne

00:00:31.965 --> 00:00:33.960
une visualisation de données ainsi qu'une

00:00:33.960 --> 00:00:36.600
expérimenté au travail
sur les données n'importe où,

00:00:36.600 --> 00:00:38.970
s'il s'agit de données sur place ainsi

00:00:38.970 --> 00:00:41.755
données à l'intérieur des clusters Big Data.

00:00:41.755 --> 00:00:45.470
Donc, dans cet ajout d'Azure
Data Studio, comme vous pouvez le voir,

00:00:45.470 --> 00:00:47.870
J'ai un bord de base de données SQL et

00:00:47.870 --> 00:00:51.080
un SQL Server Big Data
Cluster je suis connecté.

00:00:51.080 --> 00:00:56.075
Maintenant, dans Azure Data Studio est
construit sur le dessus des extensions.

00:00:56.075 --> 00:00:59.300
Donc, l'une des choses avec
Azure Data Studio fournit est

00:00:59.300 --> 00:01:00.830
une capacité d'installer

00:01:00.830 --> 00:01:03.830
toute extension que vous pourriez
comme pour votre opération de données.

00:01:03.830 --> 00:01:06.155
Donc, ici, l'une des extensions
que nous allons

00:01:06.155 --> 00:01:08.830
installer aujourd'hui est appelé SandDance.

00:01:08.830 --> 00:01:12.035
SandDance est une donnée
l'expérience de visualisation.

00:01:12.035 --> 00:01:15.050
Il fournit l'unité
visualisation des données

00:01:15.050 --> 00:01:18.365
vous souhaitez explorer
et de visualiser dans SandDance.

00:01:18.365 --> 00:01:21.515
Donc ici, je suis en train d'installer
l'extension SandDance,

00:01:21.515 --> 00:01:22.955
et comme vous pouvez le voir,

00:01:22.955 --> 00:01:25.535
l'extension SandDance
vient d'être installé.

00:01:25.535 --> 00:01:28.775
Revenons donc à
où se sisoient les données.

00:01:28.775 --> 00:01:32.720
J'ai donc des données à l'intérieur de la
SQL Server Big Data Cluster.

00:01:32.720 --> 00:01:35.585
Le SQL Server Big Data
Cluster est livré avec

00:01:35.585 --> 00:01:38.330
HDFS avec le cluster Big Data

00:01:38.330 --> 00:01:40.745
où nous pouvons stocker
volume élevé de données.

00:01:40.745 --> 00:01:44.510
Une de ces données que j'ai
stocké sa part dans HDFS par exemple

00:01:44.510 --> 00:01:48.695
de SQL Server Big Data
Cluster est un demovote.tsv.

00:01:48.695 --> 00:01:51.755
Alors maintenant, jetons un oeil à
à quoi ressemblent ces données.

00:01:51.755 --> 00:01:54.230
Donc, si vous faites un rapide
aperçu des données,

00:01:54.230 --> 00:01:58.040
les jeux de données s'ouvrent à partir de HDFS,

00:01:58.040 --> 00:01:59.150
et comme vous pouvez le voir,

00:01:59.150 --> 00:02:01.115
ce n'est rien d'autre que des données de vote.

00:02:01.115 --> 00:02:03.230
Il dispose des données de vote
pendant l'Obama,

00:02:03.230 --> 00:02:04.625
Romney calendrier de

00:02:04.625 --> 00:02:07.160
élections qui ont eu lieu
à travers les États-Unis.

00:02:07.160 --> 00:02:11.540
Maintenant, si je dois traiter cette
ensemble de données particuliers et de le donner à

00:02:11.540 --> 00:02:15.925
mes scientifiques de données à réellement
logique à partir des données,

00:02:15.925 --> 00:02:18.010
il aurait à effectivement
construire des rapports,

00:02:18.010 --> 00:02:19.265
et s'il utilise

00:02:19.265 --> 00:02:22.330
bibliothèque de visualisation de données
structurelle pour le voir,

00:02:22.330 --> 00:02:24.845
ou il utilise un peu de code

00:02:24.845 --> 00:02:27.695
pour visualiser réellement
à quoi ressemblent les données.

00:02:27.695 --> 00:02:29.509
Mais dans Azure Data Studio,

00:02:29.509 --> 00:02:33.170
nous avons notre clic droit
option de vue dans SandDance.

00:02:33.170 --> 00:02:36.070
Jetons un coup d'oeil à la façon dont
ces données ressemblent.

00:02:36.070 --> 00:02:39.705
Maintenant, vous pouvez voir que
SandDance se charge,

00:02:39.705 --> 00:02:42.525
et SandDance en fait
auto compris que

00:02:42.525 --> 00:02:45.480
ces données ont de la latitude,

00:02:45.480 --> 00:02:47.765
longitude, et l'intrigue de dispersion serait

00:02:47.765 --> 00:02:51.140
le meilleur graphique à choisir pour
traçant ces données particulières.

00:02:51.140 --> 00:02:55.610
Nous avons donc un tableau de recommandation
type construit à l'intérieur de SandDance.

00:02:55.610 --> 00:02:57.395
Alors maintenant, ces données semblent bonnes.

00:02:57.395 --> 00:02:59.300
Je peux voir que la carte
des États-Unis,

00:02:59.300 --> 00:03:01.040
comme prévu parce que les données de vote,

00:03:01.040 --> 00:03:03.590
et avoir l'axe x et
l'axe y ainsi.

00:03:03.590 --> 00:03:07.640
Maintenant, encore je ne sais pas s'il ya

00:03:07.640 --> 00:03:10.220
plus d'informations dans
les données et je pourrais

00:03:10.220 --> 00:03:13.760
évidemment filtrer en termes de
l'axe x et l'axe y,

00:03:13.760 --> 00:03:16.760
mais ne serait-il pas grand si je
pourrait effectivement tracer ce dans

00:03:16.760 --> 00:03:19.085
un espace tridimensionnel pour réellement

00:03:19.085 --> 00:03:21.935
voir lequel pourrait être
le meilleur classificateur.

00:03:21.935 --> 00:03:26.085
Donc, nous allons faire ce graphique
en trois dimensions.

00:03:26.085 --> 00:03:28.620
Donc, si je clique sur "SandDance" et si je

00:03:28.620 --> 00:03:31.575
cliquez sur le "Trois dimensions
un », maintenant j'ai l'axe z.

00:03:31.575 --> 00:03:35.840
Maintenant, dans l'axe z, je peux
choisir un revenu et voir

00:03:35.840 --> 00:03:38.015
à travers les États-Unis ce que

00:03:38.015 --> 00:03:40.715
la démographie des revenus
du peuple sont.

00:03:40.715 --> 00:03:42.740
Vous pouvez voir que
Washington va bien,

00:03:42.740 --> 00:03:44.855
Delaware va un peu mieux,

00:03:44.855 --> 00:03:47.960
puis à New York et
Miami est super aussi.

00:03:47.960 --> 00:03:49.760
Mais jetons un oeil à,

00:03:49.760 --> 00:03:51.725
en termes de valeur médiane de la maison,

00:03:51.725 --> 00:03:53.180
à quoi sont les prix à la recherche?

00:03:53.180 --> 00:03:56.840
Vous pouvez voir que le graphique
s'est ajusté automatiquement.

00:03:56.840 --> 00:04:02.045
Vous pourriez également avoir un
schémas de couleur que vous pouvez utiliser.

00:04:02.045 --> 00:04:04.580
Pour que je puisse voir.le revenu,

00:04:04.580 --> 00:04:06.230
et vous pouvez voir que je peux choisir

00:04:06.230 --> 00:04:09.380
différents schémas de couleur à
en fait la couleur du graphique.

00:04:09.380 --> 00:04:13.325
Je pourrais aussi facilement
modifier la taille du compte à rebours.

00:04:13.325 --> 00:04:17.030
Donc, vous pouvez voir que comme
Je change le compte poubelle,

00:04:17.030 --> 00:04:20.380
le graphique dynamiquement
change complètement.

00:04:20.380 --> 00:04:22.130
Maintenant, c'est bon.

00:04:22.130 --> 00:04:24.865
Je peux aussi visualiser les données,

00:04:24.865 --> 00:04:27.850
zoom avant, zoom arrière, mais maintenant,

00:04:27.850 --> 00:04:32.440
J'aimerais voir si les données
ensemble me donne un moyen de

00:04:32.440 --> 00:04:34.165
où je pouvais prédire

00:04:34.165 --> 00:04:37.445
quelques anomalies si cela
existe à l'intérieur des données.

00:04:37.445 --> 00:04:40.880
Alors maintenant, commençons par faire
une certaine recherche sur le dessus des données.

00:04:40.880 --> 00:04:46.455
Donc, je vais chercher
où le revenu est inférieur à,

00:04:46.455 --> 00:04:52.829
dire 40 000 $, et aussi
ajouter une autre expression,

00:04:52.829 --> 00:04:59.675
et dire, la valeur médiane de la maison
est supérieur à 800 000 $.

00:04:59.675 --> 00:05:02.205
Cela semble être un bon chèque.

00:05:02.205 --> 00:05:04.230
Voyons si nous pouvons trouver
certains ensembles de données qui

00:05:04.230 --> 00:05:06.975
satisfait en fait à ces besoins.

00:05:06.975 --> 00:05:10.170
Maintenant, si je fais réellement
une recherche et sélectionnez,

00:05:10.170 --> 00:05:12.260
vous pouvez voir que
SandDance a quelques couples de

00:05:12.260 --> 00:05:14.660
points de données dont il
effectivement ramassé.

00:05:14.660 --> 00:05:17.210
Ceux-ci sont indiqués dans le graphique.

00:05:17.210 --> 00:05:20.080
Je pourrais facilement isoler
ces points de données,

00:05:20.080 --> 00:05:21.860
et maintenant j'ai juste

00:05:21.860 --> 00:05:24.275
un sous-ensemble de ces quatre
points de données à considérer.

00:05:24.275 --> 00:05:26.570
Vous pouvez voir qu'il y a une personne dans

00:05:26.570 --> 00:05:29.825
Comté de San Miguel qui
a acheté une maison de

00:05:29.825 --> 00:05:35.710
812 500 $ avec un revenu de 39 070 $.

00:05:35.710 --> 00:05:39.830
Donc SandDance donne en fait
vous unité de visualisation de

00:05:39.830 --> 00:05:43.985
les données que vous essayez d'explorer
et de sens à partir des données.

00:05:43.985 --> 00:05:46.220
Vous pouvez aussi faire d'autres choses

00:05:46.220 --> 00:05:49.440
comme où vous pourriez prendre
un instantané de l'image,

00:05:49.440 --> 00:05:51.150
vous voulez créer une vue instantanée,

00:05:51.150 --> 00:05:53.919
vous pourriez réellement créer un instantané,

00:05:56.720 --> 00:05:59.690
et il crée une vue instantanée.

00:05:59.690 --> 00:06:02.630
Maintenant, vous pouvez intégrer cette
vue instantanée dans un document

00:06:02.630 --> 00:06:04.160
que vous voulez
probablement l'envoyer à

00:06:04.160 --> 00:06:05.945
quelqu'un d'autre à prendre
un coup d'oeil à ainsi.

00:06:05.945 --> 00:06:08.330
C'est donc ainsi que nous fournissons

00:06:08.330 --> 00:06:10.400
visualisation des données dans le contexte de

00:06:10.400 --> 00:06:12.635
les données dans laquelle vous oéquissez.

00:06:12.635 --> 00:06:16.880
Maintenant, aussi l'un des
choses que nous avons ajouté

00:06:16.880 --> 00:06:22.925
à l'intérieur SandDance était la capacité
pour visualiser les résultats de la requête.

00:06:22.925 --> 00:06:26.060
Donc, ici, j'ai un
base de données que j'ai créée,

00:06:26.060 --> 00:06:30.020
et dans cette base de données particulière
J'ai une table de données de capteur.

00:06:30.020 --> 00:06:32.840
Donc maintenant, si je ne sélectionnez un 1000

00:06:32.840 --> 00:06:35.705
de ce particulier
table et je pourrais

00:06:35.705 --> 00:06:38.135
aussi cliquer sur ce graphique

00:06:38.135 --> 00:06:41.839
ici et charger ces données dans
la Danse de sable comme visualiseur,

00:06:41.839 --> 00:06:44.495
si ce n'est que le capteur
données et il n'a pas

00:06:44.495 --> 00:06:47.210
aussi intéressant que le
données de vote est, mais encore,

00:06:47.210 --> 00:06:50.360
cela vous donne une vue rapide de ce que

00:06:50.360 --> 00:06:54.655
la visualisation des données dans le
contexte de la requête pourrait être comme.

00:06:54.655 --> 00:06:57.025
Maintenant, dans cette vidé o particulière,

00:06:57.025 --> 00:07:00.035
vous avez vu comment nous sommes
en utilisant SandDance pour réellement

00:07:00.035 --> 00:07:03.665
visualiser rapidement les données et

00:07:03.665 --> 00:07:05.705
tendances significatives et de comprendre

00:07:05.705 --> 00:07:07.190
ce que les tendances se produisent à partir de

00:07:07.190 --> 00:07:09.140
les données afin qu'il puisse vous aider dans

00:07:09.140 --> 00:07:11.435
machine avancée de construction
algorithmes d'apprentissage.

00:07:11.435 --> 00:07:13.100
Merci beaucoup pour
écoute dans aujourd'hui.

00:07:13.100 --> 00:07:27.910
[MUSIQUE].

