WEBVTT

00:00:09.680 --> 00:00:10.780
>> [음악].

00:00:10.780 --> 00:00:12.750
[> 안녕하세요. 나는 비키 하프와 함께
SQL Server 제품 팀을 구성할 수 있습니다.

00:00:12.750 --> 00:00:15.870
오늘 이자리에 오세요.
노트북 및 Azure 데이터 스튜디오.

00:00:15.870 --> 00:00:18.825
따라서 노트북은

00:00:18.825 --> 00:00:20.660
그동안 의학계의 데이터 과학

00:00:20.660 --> 00:00:22.940
많은 일을 하는 데 사용
데이터 시각화,

00:00:22.940 --> 00:00:25.010
데이터 탐색 및 데이터 작업,

00:00:25.010 --> 00:00:26.855
주로 파이썬 언어로 사용됩니다.

00:00:26.855 --> 00:00:28.760
사람들이 이야기할 때
노트북에 대해,

00:00:28.760 --> 00:00:30.485
우리가 말하는 많은 시간
목성 노트북에 대해.

00:00:30.485 --> 00:00:32.660
그래서 노트북의 구현

00:00:32.660 --> 00:00:34.730
Azure 데이터 스튜디오에 있는 것은

00:00:34.730 --> 00:00:37.070
목성 노트북과
사용자 정의 프런트 엔드입니다.

00:00:37.070 --> 00:00:40.430
더 나은 맞춤형
Azure 데이터 스튜디오 환경입니다.

00:00:40.430 --> 00:00:45.450
먼저, 내가 보여줄거야
당신은 간단한 파이썬 노트북.

00:00:45.450 --> 00:00:46.760
이 노트북은

00:00:46.760 --> 00:00:49.250
파이썬 언어와
당신은 우리가 있어 볼 수 있습니다

00:00:49.250 --> 00:00:51.620
여기까지 섹션입니다.

00:00:51.620 --> 00:00:54.395
사람이 읽을 수 있는 텍스트와
코드가 있는 섹션이 있습니다.

00:00:54.395 --> 00:00:56.149
그래서 만약 내가 이것에 실행을 명중,

00:00:56.149 --> 00:00:58.010
이 특정 코드는

00:00:58.010 --> 00:01:00.755
인터넷을 통해
강아지의 임의의 사진.

00:01:00.755 --> 00:01:03.710
주변에 표시하려면
노트북 체험,

00:01:03.710 --> 00:01:05.390
우리는 여기에 피커가,

00:01:05.390 --> 00:01:06.770
우리는 언어를 선택할 수 있습니다.

00:01:06.770 --> 00:01:08.630
그래서이 경우, 나는
파이썬 3을 실행,

00:01:08.630 --> 00:01:10.475
그리고 나는 그것을 실행하고 있어요
로컬 컴퓨터에서.

00:01:10.475 --> 00:01:13.460
나는 대신에 로 이동할 수 있습니다.
언어 SQL을 한 다음

00:01:13.460 --> 00:01:16.430
MySQL 서버 중 어느 서버를 선택하
내가 연결하려는 기계.

00:01:16.430 --> 00:01:18.605
MySQL 서버가 여기에 나열되어 있습니다.

00:01:18.605 --> 00:01:21.830
그래서 조금 더 걸릴,

00:01:21.830 --> 00:01:24.230
예를 들어 보겠습니다.
사용 방법에 대해 설명합니다.

00:01:24.230 --> 00:01:28.025
그래서 여기에 SQL 서버가 있습니다.
2019 빅데이터 클러스터

00:01:28.025 --> 00:01:32.555
는 Kubernetes에서 실행 중인 SQL 서버입니다.
SQL과 스파크를 모두 함께 할 수 있습니다.

00:01:32.555 --> 00:01:34.490
그래서 여기에 내 HDFS 섹션에서,

00:01:34.490 --> 00:01:38.040
이 디렉토리를 얻었습니다.
CSV 파일로 가득합니다.

00:01:38.040 --> 00:01:40.890
내가 그것을 보면, 그것을 미리 보기,

00:01:40.890 --> 00:01:42.260
당신은 그것의 많은 것을 볼 수 있습니다

00:01:42.260 --> 00:01:44.780
개에 대한 정보
라이센스 정보.

00:01:44.780 --> 00:01:46.970
그래서 이것은 실제로 의 데이터 덤프입니다.

00:01:46.970 --> 00:01:48.320
펜실베이니아주 앨러게니 카운티

00:01:48.320 --> 00:01:51.230
반려견 면허증
지난 몇 년 동안.

00:01:51.230 --> 00:01:55.775
그래서 스파크를 사용 하 여
언어 및 연결

00:01:55.775 --> 00:02:00.440
에 스파크를 사용하여 파이썬에
SQL 서버 빅 데이터 클러스터.

00:02:00.440 --> 00:02:02.045
나는 달릴 수 있어,

00:02:02.045 --> 00:02:05.780
코드를 사용하여 해당 파일을 읽습니다.
CSV에서 직접 나올 수 있습니다.

00:02:05.780 --> 00:02:07.760
그런 다음 몇 가지 분석을 수행 할 수 있습니다.

00:02:07.760 --> 00:02:09.890
그래서이 경우, 나는
행 수를 가져옵니다.

00:02:09.890 --> 00:02:15.645
나는 별개의 목록을 거야
단지 이름의 목록,

00:02:15.645 --> 00:02:17.215
그래서 우리는 25,000 개의 이름을 가지고 있습니다.

00:02:17.215 --> 00:02:20.825
그럼 난 당겨거야
그 모자에서 임의의 이름.

00:02:20.825 --> 00:02:22.550
그래서 우리는 여기에 이름이 있습니다.

00:02:22.550 --> 00:02:25.850
지금, 내가 스파크를 사용하는 경우,

00:02:25.850 --> 00:02:29.120
나는 매우 사용하는 데 사용되는 경우
파이썬, 그것은 좋은 것입니다.

00:02:29.120 --> 00:02:30.770
하지만 SQL 에 더 가깝다면,

00:02:30.770 --> 00:02:33.320
어쩌면 내가 연결하고 싶어
동일한 데이터 집합으로,

00:02:33.320 --> 00:02:36.040
클러스터를 실행합니다.
SQL 언어를 사용합니다.

00:02:36.040 --> 00:02:41.420
여기, 나는 외부를 만들었습니다
해당 파일 형식에 대한 테이블입니다.

00:02:41.420 --> 00:02:43.870
이것은 당신이 뭔가
마법사를 사용하여 수행할 수 있습니다.

00:02:43.870 --> 00:02:45.250
내가 여기 갈거야,

00:02:45.250 --> 00:02:46.930
CSV 파일에서 외부 테이블을 만듭니다.

00:02:46.930 --> 00:02:50.315
그런 다음 이
사용 중이면 외부 테이블입니다.

00:02:50.315 --> 00:02:52.415
그러나이 경우, 나는
코드를 사용하여 완료했습니다.

00:02:52.415 --> 00:02:56.500
런 셀을 치면

00:02:56.500 --> 00:02:59.765
또한 SQL을 사용하고 있음을 알 수 있습니다.

00:02:59.765 --> 00:03:03.625
동일한 데이터에 액세스하기 위해
방금 스파크를 사용하여 액세스했습니다.

00:03:03.625 --> 00:03:07.410
이제 이러한 파일은
IPYNB 파일로 저장,

00:03:07.410 --> 00:03:10.970
나는 다음 내 공유 할 수 있습니다
동료들과 나는 다시 실행할 수 있습니다.

00:03:10.970 --> 00:03:14.465
그래서 경우에 나는
오늘 이 것을 실행하고 싶었습니다.

00:03:14.465 --> 00:03:15.995
내 동료에게 보내,

00:03:15.995 --> 00:03:18.950
그들은 그것을 열 수 있습니다.
그들의 인스턴트에

00:03:18.950 --> 00:03:20.480
클러스터에 연결하거나

00:03:20.480 --> 00:03:22.535
내 클러스터에 다시 실행합니다.

00:03:22.535 --> 00:03:24.800
우리는 또한 노트북을 사용하고 있습니다
몇 가지 다른 방법으로.

00:03:24.800 --> 00:03:27.485
여기, 우리는 뭔가가
목성 책이라고합니다.

00:03:27.485 --> 00:03:30.710
이것은 기본적으로 노트북의 목록입니다

00:03:30.710 --> 00:03:34.130
함께 컴파일된
장 페이지 형식으로 변환됩니다.

00:03:34.130 --> 00:03:37.775
그래서 여기에 우리는 SQL이
서버 ML 서비스 코스,

00:03:37.775 --> 00:03:40.985
노트북을 통해 표시됩니다.

00:03:40.985 --> 00:03:43.070
그래서 우리는 모든
문서가 있습니다.

00:03:43.070 --> 00:03:46.445
코드 샘플이 있습니다.
여기 그리고 당신은 할 수 있습니다,

00:03:46.445 --> 00:03:47.780
각 장의 끝에,

00:03:47.780 --> 00:03:49.730
둘 중 하나는 다음 을 명중
버튼은 다음으로 이동

00:03:49.730 --> 00:03:52.400
하나 또는 이 장을 사용
브라우저를 선택합니다.

00:03:52.400 --> 00:03:54.965
우리는 또한
지원 성 책

00:03:54.965 --> 00:03:57.255
SQL Server 2019용
빅 데이터 클러스터.

00:03:57.255 --> 00:03:59.210
내가 키우면
명령 파일럿 및 선택

00:03:59.210 --> 00:04:01.160
이 목성 책 2019 가이드,

00:04:01.160 --> 00:04:03.035
그게 내가 이것을 여는 데 사용하는 것입니다.

00:04:03.035 --> 00:04:05.960
여기에, 우리는 모든
정보를

00:04:05.960 --> 00:04:08.885
지원하기 위해 필요
새로운 빅 데이터 클러스터,

00:04:08.885 --> 00:04:11.585
많은 쿠베르네테스 사령부,
클러스터 정보를 볼 수 있습니다.

00:04:11.585 --> 00:04:13.565
이것은 당신이 실행할 수있는 무언가이다,

00:04:13.565 --> 00:04:14.735
다른 사람에게 보낼 수 있습니다.

00:04:14.735 --> 00:04:17.065
저장하고
당신이 원하는 것을 할 수 있습니다.

00:04:17.065 --> 00:04:21.140
그래서 우리는 매우 흥분
Azure 데이터 스튜디오의 전자 필기장입니다.

00:04:21.140 --> 00:04:23.210
우리는 정말이 생각
그것은 될 것입니다 뭔가

00:04:23.210 --> 00:04:26.210
우리 지역 사회에 매우 유용합니다.

00:04:26.210 --> 00:04:28.040
우리는 정말 관심이 있어요
방법을 알아내기 위해

00:04:28.040 --> 00:04:29.765
당신은 그것을 사용하고
당신이 우리에게서 원하는.

00:04:29.765 --> 00:04:32.800
그래서 만약 당신이에 관심이
더 많은 것을 배우고, GitHub로 이동하십시오.

00:04:32.800 --> 00:04:34.610
Azure 데이터 스튜디오를 찾고

00:04:34.610 --> 00:04:37.120
기능을 열 수 있습니다.
인터 버그를 요청합니다.

00:04:37.120 --> 00:04:39.470
그것은 또한 당신이 어디에
두 를 모두 다운로드할 수 있습니다.

00:04:39.470 --> 00:04:51.991
안정및 내부자 추가.
시간을 주셔서 대단히 감사합니다.

00:04:51.991 --> 00:04:57.040
>> [음악]

