WEBVTT

00:00:00.000 --> 00:00:10.530
[음악].

00:00:10.530 --> 00:00:12.300
안녕, 저는 로니 채터지입니다.

00:00:12.300 --> 00:00:15.180
저는 수석 제품 관리자입니다.
Azure 데이터 팀에서

00:00:15.180 --> 00:00:17.190
나는 SQL 서버 제품에서 작업하고

00:00:17.190 --> 00:00:19.605
오늘 저는
우리가 가지고있는 것을 보여

00:00:19.605 --> 00:00:22.230
데이터로 구축
시각화 경험

00:00:22.230 --> 00:00:25.410
Azure 데이터 스튜디오에서
시작해 봅시다.

00:00:25.410 --> 00:00:27.690
Azure 데이터 스튜디오에서

00:00:27.690 --> 00:00:31.965
당신은 당신을 제공하는 제품이

00:00:31.965 --> 00:00:33.960
데이터 시각화뿐만 아니라

00:00:33.960 --> 00:00:36.600
일하는 경험
어디서나 데이터를 통해,

00:00:36.600 --> 00:00:38.970
온-프레미스 데이터 여부

00:00:38.970 --> 00:00:41.755
빅 데이터 클러스터 내부의 데이터로 표시됩니다.

00:00:41.755 --> 00:00:45.470
그래서 Azure의이 추가
데이터 스튜디오, 당신이 볼 수 있듯이,

00:00:45.470 --> 00:00:47.870
SQL 데이터베이스 에지가 있고

00:00:47.870 --> 00:00:51.080
SQL 서버 빅 데이터
클러스터에 연결되어 있습니다.

00:00:51.080 --> 00:00:56.075
이제 Azure 데이터 스튜디오에서
확장 의 상단에 내장.

00:00:56.075 --> 00:00:59.300
그래서 것들 중 하나는
Azure 데이터 스튜디오는

00:00:59.300 --> 00:01:00.830
설치 기능

00:01:00.830 --> 00:01:03.830
당신이 할 수있는 모든 확장
데이터 작업에 좋아요.

00:01:03.830 --> 00:01:06.155
그래서 여기에, 확장 중 하나
우리가 가고있는

00:01:06.155 --> 00:01:08.830
오늘 설치는 샌드 댄스라고합니다.

00:01:08.830 --> 00:01:12.035
샌드댄스는 데이터입니다.
시각화 경험.

00:01:12.035 --> 00:01:15.050
그것은 단위를 제공합니다
데이터에 대한 시각화

00:01:15.050 --> 00:01:18.365
탐험하고 싶습니다.
샌드댄스에서 시각화할 수 있습니다.

00:01:18.365 --> 00:01:21.515
그래서 여기에 설치해요
샌드댄스 확장,

00:01:21.515 --> 00:01:22.955
그리고 당신이 볼 수 있듯이,

00:01:22.955 --> 00:01:25.535
샌드댄스 확장
방금 설치되었습니다.

00:01:25.535 --> 00:01:28.775
다시 돌아가봅시다.
데이터가 있는 위치입니다.

00:01:28.775 --> 00:01:32.720
그래서 내부에 데이터가 있습니다.
SQL 서버 빅 데이터 클러스터.

00:01:32.720 --> 00:01:35.585
SQL 서버 빅 데이터
클러스터와 함께 제공

00:01:35.585 --> 00:01:38.330
빅 데이터 클러스터가 있는 HDFS

00:01:38.330 --> 00:01:40.745
우리가 저장할 수있는 곳
데이터의 대용량.

00:01:40.745 --> 00:01:44.510
내가 가지고있는 하나의 데이터
예를 들어 HDFS에 저장

00:01:44.510 --> 00:01:48.695
SQL 서버 빅 데이터
클러스터는 데모투표입니다.

00:01:48.695 --> 00:01:51.755
이제 살펴보겠습니다.
이 데이터의 모양을 확인할 수 있습니다.

00:01:51.755 --> 00:01:54.230
그래서 만약 당신이 빨리 할
데이터 미리 보기,

00:01:54.230 --> 00:01:58.040
데이터 집합은 HDFS에서 열립니다.

00:01:58.040 --> 00:01:59.150
그리고 당신이 볼 수 있듯이,

00:01:59.150 --> 00:02:01.115
이것은 투표 데이터에 불과합니다.

00:02:01.115 --> 00:02:03.230
투표 데이터가 있습니다.
오바마 시대에,

00:02:03.230 --> 00:02:04.625
롬니 의 시간 프레임

00:02:04.625 --> 00:02:07.160
일어난 선거
미국 전역에 걸쳐.

00:02:07.160 --> 00:02:11.540
지금, 나는이 처리해야하는 경우
특정 데이터 세트를 설정하고

00:02:11.540 --> 00:02:15.925
내 데이터 과학자는 실제로
데이터에서 의미가,

00:02:15.925 --> 00:02:18.010
그는 실제로 해야 할 것 이다
일부 보고서를 작성하고,

00:02:18.010 --> 00:02:19.265
그리고 그가 사용하는지 여부

00:02:19.265 --> 00:02:22.330
데이터 시각화 라이브러리
그것을 볼 구조,

00:02:22.330 --> 00:02:24.845
또는 일부 코드를 사용합니다.

00:02:24.845 --> 00:02:27.695
실제로 시각화하려면
데이터의 모양을 참조하십시오.

00:02:27.695 --> 00:02:29.509
그러나 Azure 데이터 스튜디오에서는

00:02:29.509 --> 00:02:33.170
우리는 우리의 오른쪽 클릭이
샌드댄스에서 볼 수 있습니다.

00:02:33.170 --> 00:02:36.070
의 방법을 살펴 보자
이 데이터는 다음과 같습니다.

00:02:36.070 --> 00:02:39.705
지금, 당신은 볼 수 있습니다
샌드댄스가 로드되고 있습니다.

00:02:39.705 --> 00:02:42.525
그리고 샌드 댄스 실제로
자동 알아냈다.

00:02:42.525 --> 00:02:45.480
이 데이터는 위도를 가지고,

00:02:45.480 --> 00:02:47.765
경도, 산점도는

00:02:47.765 --> 00:02:51.140
선택할 수있는 가장 좋은 차트
이 특정 데이터를 플로팅합니다.

00:02:51.140 --> 00:02:55.610
그래서 우리는 추천 차트를 가지고
샌드 댄스 내부에 내장 된 유형.

00:02:55.610 --> 00:02:57.395
이제이 데이터가 좋아 보입니다.

00:02:57.395 --> 00:02:59.300
지도를 볼 수 있습니다
미국의

00:02:59.300 --> 00:03:01.040
투표 데이터가 있기 때문에 예상대로,

00:03:01.040 --> 00:03:03.590
x축을 가지고 있고
y축도 마찬가지입니다.

00:03:03.590 --> 00:03:07.640
지금도

00:03:07.640 --> 00:03:10.220
자세한 내용은 다음 을 참조하십시오.
데이터와 나는 할 수

00:03:10.220 --> 00:03:13.760
분명히 의 관점에서 필터링
x축과 y축,

00:03:13.760 --> 00:03:16.760
하지만 내가 있다면 그것은 좋은 되지 않을 것 이라고
실제로 이것을 플롯할 수 있습니다.

00:03:16.760 --> 00:03:19.085
실제로 3차원 공간을

00:03:19.085 --> 00:03:21.935
어떤 것이 될 수 있는지 확인합니다.
최고의 분류자.

00:03:21.935 --> 00:03:26.085
그래서이 그래프를 만들어 보자
3차원 입니다.

00:03:26.085 --> 00:03:28.620
그래서 "샌드 댄스"를 클릭하고 만약 내가

00:03:28.620 --> 00:03:31.575
"3차원"을 클릭합니다.
하나,"지금은 z 축을 가지고있다.

00:03:31.575 --> 00:03:35.840
이제 z축에서 할 수 있습니다.
소득을 선택하고 참조

00:03:35.840 --> 00:03:38.015
미국 전역에서

00:03:38.015 --> 00:03:40.715
소득 인구 통계
국민의 말입니다.

00:03:40.715 --> 00:03:42.740
당신은 볼 수 있습니다
워싱턴은 선한 일을 하고 있습니다.

00:03:42.740 --> 00:03:44.855
델라웨어는 조금 더 잘하고 있습니다.

00:03:44.855 --> 00:03:47.960
그리고 뉴욕에서
마이애미도 훌륭합니다.

00:03:47.960 --> 00:03:49.760
하지만 한 번 살펴보겠습니다.

00:03:49.760 --> 00:03:51.725
주택 중앙값의 관점에서,

00:03:51.725 --> 00:03:53.180
가격은 어떻게 찾고 있습니까?

00:03:53.180 --> 00:03:56.840
그래프를 볼 수 있습니다.
자동으로 조정됩니다.

00:03:56.840 --> 00:04:02.045
또한 다양한
사용할 수 있습니다.

00:04:02.045 --> 00:04:04.580
그래서 저는 실제로 수입을 볼 수 있었습니다.

00:04:04.580 --> 00:04:06.230
그리고 당신은 내가 선택할 수 있음을 볼 수 있습니다

00:04:06.230 --> 00:04:09.380
다른 색상 스키마를
실제로 그래프에 색상을 채색합니다.

00:04:09.380 --> 00:04:13.325
나는 또한 쉽게 할 수 있었다
bincount 크기를 변경합니다.

00:04:13.325 --> 00:04:17.030
그래서 당신은 로 볼 수 있습니다
빈카운트를 변경해,

00:04:17.030 --> 00:04:20.380
동적으로 그래프
완전히 변경됩니다.

00:04:20.380 --> 00:04:22.130
이제 이것은 좋다.

00:04:22.130 --> 00:04:24.865
나는 또한 데이터를 시각화 할 수 있습니다,

00:04:24.865 --> 00:04:27.850
확대, 축소,하지만 지금은

00:04:27.850 --> 00:04:32.440
데이터가
세트는 나에게 어떤 방법을 주고있다

00:04:32.440 --> 00:04:34.165
내가 예측할 수 있는 곳

00:04:34.165 --> 00:04:37.445
몇 가지 이상 징후는 경우
데이터 내에 존재합니다.

00:04:37.445 --> 00:04:40.880
이제 시작해 봅시다.
데이터 맨 위에 있는 일부 검색.

00:04:40.880 --> 00:04:46.455
그래서 내가 검색 할거야
소득이 보다 적은 경우,

00:04:46.455 --> 00:04:52.829
$ 40,000, 또한 말
다른 식을 추가하면

00:04:52.829 --> 00:04:59.675
그리고 말, 중앙 값
$ 800,000 보다 큽합니다.

00:04:59.675 --> 00:05:02.205
그것은 좋은 검사 것 같습니다.

00:05:02.205 --> 00:05:04.230
우리가 찾을 수 있는지 보자
일부 데이터 세트는

00:05:04.230 --> 00:05:06.975
실제로 이 요구를 충족시킵니다.

00:05:06.975 --> 00:05:10.170
지금, 만약 내가 실제로
검색 및 선택,

00:05:10.170 --> 00:05:12.260
당신은 볼 수 있습니다
샌드댄스에는 몇 가지

00:05:12.260 --> 00:05:14.660
데이터 포인트가
실제로 그것을 집어 들었다.

00:05:14.660 --> 00:05:17.210
그래프에 표시됩니다.

00:05:17.210 --> 00:05:20.080
쉽게 격리할 수 있습니다.
이러한 데이터 포인트,

00:05:20.080 --> 00:05:21.860
그리고 지금 난 그냥

00:05:21.860 --> 00:05:24.275
이 네 가지 의 하위 집합
고려해야 할 데이터 포인트입니다.

00:05:24.275 --> 00:05:26.570
당신은 에 사람이 있다는 것을 볼 수 있습니다

00:05:26.570 --> 00:05:29.825
산 미구엘 카운티 누구
의 집을 구입했습니다.

00:05:29.825 --> 00:05:35.710
$ 39,070의 소득 $ 812,500.

00:05:35.710 --> 00:05:39.830
그래서 샌드 댄스는 실제로
당신은 단위 시각화의

00:05:39.830 --> 00:05:43.985
탐색하려는 데이터
데이터에서 의미가 있습니다.

00:05:43.985 --> 00:05:46.220
다른 일도 할 수 있습니다.

00:05:46.220 --> 00:05:49.440
당신이 취할 수있는 곳처럼
사진의 스냅샷,

00:05:49.440 --> 00:05:51.150
스냅샷 뷰를 만들려는 경우

00:05:51.150 --> 00:05:53.919
실제로 스냅샷을 만들 수 있습니다.

00:05:56.720 --> 00:05:59.690
스냅샷 뷰를 만듭니다.

00:05:59.690 --> 00:06:02.630
지금 당신은이 포함 할 수 있습니다
문서의 스냅샷 보기

00:06:02.630 --> 00:06:04.160
원하는
아마 그것을 통해 보내

00:06:04.160 --> 00:06:05.945
다른 사람이 취할 수
뿐만 아니라 봐.

00:06:05.945 --> 00:06:08.330
이것이 우리가 제공하는 방식입니다.

00:06:08.330 --> 00:06:10.400
데이터 시각화를

00:06:10.400 --> 00:06:12.635
운영 중인 데이터입니다.

00:06:12.635 --> 00:06:16.880
지금, 또한 중 하나
우리가 추가 한 것들

00:06:16.880 --> 00:06:22.925
내부 샌드 댄스는 능력이었다
을 사용하여 쿼리 결과를 시각화합니다.

00:06:22.925 --> 00:06:26.060
그래서 여기에 내가 있다
내가 만든 데이터베이스,

00:06:26.060 --> 00:06:30.020
이 특정 데이터베이스에서
센서 데이터 테이블이 있습니다.

00:06:30.020 --> 00:06:32.840
이제 1,000을 선택합니다.

00:06:32.840 --> 00:06:35.705
그 특정에서
테이블과 나는 할 수

00:06:35.705 --> 00:06:38.135
또한이 차트를 클릭

00:06:38.135 --> 00:06:41.839
이 데이터를 로드하려면
샌드댄스를 비주얼라이저로,

00:06:41.839 --> 00:06:44.495
이것은 단지 센서일 뿐입니다.
데이터를 가지고 있지 않습니다.

00:06:44.495 --> 00:06:47.210
만큼이나 흥미롭습니다.
투표 데이터는 여전히

00:06:47.210 --> 00:06:50.360
이렇게 하면

00:06:50.360 --> 00:06:54.655
데이터 시각화를
쿼리의 컨텍스트가 같을 수 있습니다.

00:06:54.655 --> 00:06:57.025
이제이 특정 비디오에서,

00:06:57.025 --> 00:07:00.035
당신은 우리가 어떻게 보았다
실제로 샌드댄스를 사용하여

00:07:00.035 --> 00:07:03.665
데이터를 신속하게 시각화하고

00:07:03.665 --> 00:07:05.705
의미 있는 동향을 파악하고 이해

00:07:05.705 --> 00:07:07.190
동향은 에서 일어나고있다

00:07:07.190 --> 00:07:09.140
데이터를 통해

00:07:09.140 --> 00:07:11.435
고급 기계 구축
학습 알고리즘.

00:07:11.435 --> 00:07:13.100
정말 고마워요
오늘 듣기.

00:07:13.100 --> 00:07:27.910
[음악].

