WEBVTT

00:00:09.680 --> 00:00:10.780
Музыка.

00:00:10.780 --> 00:00:12.750
Привет. Я Вики Арп с
команда продуктов S'L Server.

00:00:12.750 --> 00:00:15.870
Я здесь сегодня, чтобы показать вам
Ноутбуки и студия данных Azure.

00:00:15.870 --> 00:00:18.825
Так ноутбуки являются концепцией в

00:00:18.825 --> 00:00:20.660
Наука о данных, которая была

00:00:20.660 --> 00:00:22.940
используется, чтобы сделать много
визуализация данных,

00:00:22.940 --> 00:00:25.010
разведка данных и работа с данными,

00:00:25.010 --> 00:00:26.855
в основном на языке Python.

00:00:26.855 --> 00:00:28.760
Когда люди разговаривают
о ноутбуках,

00:00:28.760 --> 00:00:30.485
много раз мы говорим
о ноутбуках Jupiter.

00:00:30.485 --> 00:00:32.660
Таким образом, реализация ноутбуков

00:00:32.660 --> 00:00:34.730
что у нас есть в Azure Data Studio,

00:00:34.730 --> 00:00:37.070
блокнот юпитера с
пользовательские передний конец, что это

00:00:37.070 --> 00:00:40.430
лучше с учетом вписываются в
Опыт работы в студии данных Azure.

00:00:40.430 --> 00:00:45.450
Итак, во-первых, я собираюсь показать
вы простой ноутбук Python.

00:00:45.450 --> 00:00:46.760
Это ноутбук, который имеет

00:00:46.760 --> 00:00:49.250
Язык python и
Вы можете видеть, что у нас есть

00:00:49.250 --> 00:00:51.620
раздел здесь, который является

00:00:51.620 --> 00:00:54.395
читаемый человеком текст и
раздел здесь, который имеет код.

00:00:54.395 --> 00:00:56.149
Так что, если я нажму бежать на этом,

00:00:56.149 --> 00:00:58.010
этот конкретный код призывает к

00:00:58.010 --> 00:01:00.755
Интернет и тянет вниз
случайная фотография собаки.

00:01:00.755 --> 00:01:03.710
Чтобы показать вам вокруг
Опыт работы в блокноте,

00:01:03.710 --> 00:01:05.390
у нас есть сборщик здесь,

00:01:05.390 --> 00:01:06.770
мы можем выбрать язык.

00:01:06.770 --> 00:01:08.630
Так что в этом случае, я
работает Python 3,

00:01:08.630 --> 00:01:10.475
и я бегу его
на моей местной машине.

00:01:10.475 --> 00:01:13.460
Вместо этого я мог бы перейти к
язык S'L, а затем

00:01:13.460 --> 00:01:16.430
Выбрать, какой из серверов MyS'L
машины, к которым я хочу прикрепить.

00:01:16.430 --> 00:01:18.605
У меня есть MyS'L серверов, перечисленных здесь.

00:01:18.605 --> 00:01:21.830
Чтобы взять его немного дальше,

00:01:21.830 --> 00:01:24.230
Я покажу вам пример
о том, как вы могли бы использовать это.

00:01:24.230 --> 00:01:28.025
Так вот у меня есть сервер S'L
2019 Кластер больших данных, который

00:01:28.025 --> 00:01:32.555
сервер s'L работает в Кубернете
как с S'L, так и с Spark.

00:01:32.555 --> 00:01:34.490
Так вот в моем разделе HDFS,

00:01:34.490 --> 00:01:38.040
Я получил этот каталог
полный файлов CSV.

00:01:38.040 --> 00:01:40.890
Если я взгляну на это, просмотрите его,

00:01:40.890 --> 00:01:42.260
Вы можете видеть, что это много

00:01:42.260 --> 00:01:44.780
информация о собаке
лицензионная информация.

00:01:44.780 --> 00:01:46.970
Так что это на самом деле свалка данных

00:01:46.970 --> 00:01:48.320
Аллегейни Каунти в Пенсильвании

00:01:48.320 --> 00:01:51.230
собака лицензии для
последние несколько лет.

00:01:51.230 --> 00:01:55.775
Таким образом, используя Spark
языка и подключения

00:01:55.775 --> 00:02:00.440
python с использованием Spark на
Кластер больших данных сервера S'L.

00:02:00.440 --> 00:02:02.045
Я могу бегать,

00:02:02.045 --> 00:02:05.780
код для чтения этих файлов
непосредственно из CSV.

00:02:05.780 --> 00:02:07.760
Тогда я могу сделать некоторые анализы.

00:02:07.760 --> 00:02:09.890
Так что в этом случае, я собираюсь
получить количество строк.

00:02:09.890 --> 00:02:15.645
Я собираюсь перечислить различные
список только имена,

00:02:15.645 --> 00:02:17.215
так что у нас есть 25000 имен.

00:02:17.215 --> 00:02:20.825
Тогда я собираюсь тянуть
случайное имя из этой шляпы.

00:02:20.825 --> 00:02:22.550
Так что у нас есть имя здесь.

00:02:22.550 --> 00:02:25.850
Теперь, если бы я использовала Spark,

00:02:25.850 --> 00:02:29.120
если бы я был очень привык к использованию
Python, это было бы здорово.

00:02:29.120 --> 00:02:30.770
Но если я больше человек из S'L,

00:02:30.770 --> 00:02:33.320
то, может быть, я хочу, чтобы подключиться
к тому же набору данных,

00:02:33.320 --> 00:02:36.040
Я забегу кластер
с использованием языка S'L.

00:02:36.040 --> 00:02:41.420
Здесь я создал внешний
таблица над этим форматом файла.

00:02:41.420 --> 00:02:43.870
Это то, что вы
может сделать с помощью мастера.

00:02:43.870 --> 00:02:45.250
Я пойду сюда,

00:02:45.250 --> 00:02:46.930
создать внешнюю таблицу из файлов CSV.

00:02:46.930 --> 00:02:50.315
Затем, что бы создать этот
внешняя таблица, которую я использую.

00:02:50.315 --> 00:02:52.415
Но в этом случае, я
сделали это с помощью кода.

00:02:52.415 --> 00:02:56.500
Если я ударю по бегутям ячейкам,

00:02:56.500 --> 00:02:59.765
Вы можете видеть, что я также использую S'L

00:02:59.765 --> 00:03:03.625
для доступа к тем же данным, которые
Я только что получил доступ с помощью Spark.

00:03:03.625 --> 00:03:07.410
Теперь, эти файлы
сохранены как ipYNB файлы,

00:03:07.410 --> 00:03:10.970
которые я могу поделиться с моим
коллеги, и я могу работать снова.

00:03:10.970 --> 00:03:14.465
Так что в случае, если я
хотел запустить это сегодня,

00:03:14.465 --> 00:03:15.995
отправить его к моему коллеге,

00:03:15.995 --> 00:03:18.950
они могли бы открыть его
на их мгновенный и

00:03:18.950 --> 00:03:20.480
прикрепить его к своему кластеру или

00:03:20.480 --> 00:03:22.535
к моему же кластеру и запустить его снова.

00:03:22.535 --> 00:03:24.800
Мы также используем ноутбуки
несколькими другими способами.

00:03:24.800 --> 00:03:27.485
Здесь, у нас есть что-то
называется книги юпитера.

00:03:27.485 --> 00:03:30.710
Это список в основном ноутбуки

00:03:30.710 --> 00:03:34.130
, которые были составлены вместе
в формате страницы главы.

00:03:34.130 --> 00:03:37.775
Так вот у нас есть S'L
Курс услуг СерверА ML,

00:03:37.775 --> 00:03:40.985
который показан через ноутбуки.

00:03:40.985 --> 00:03:43.070
Таким образом, у нас есть все
документации настоящее время.

00:03:43.070 --> 00:03:46.445
У нас есть образцы кода
здесь, а затем вы можете,

00:03:46.445 --> 00:03:47.780
в конце каждой главы,

00:03:47.780 --> 00:03:49.730
либо ударил следующий
кнопка, чтобы перейти к следующему

00:03:49.730 --> 00:03:52.400
один или использовать эту главу
браузер, чтобы выбрать его.

00:03:52.400 --> 00:03:54.965
Мы также получили
книга поддержки

00:03:54.965 --> 00:03:57.255
для сервера S'L 2019
Кластеры больших данных.

00:03:57.255 --> 00:03:59.210
Если бы я поднял
командный пилот и выбрать

00:03:59.210 --> 00:04:01.160
это книги jupiter 2019 руководство,

00:04:01.160 --> 00:04:03.035
это то, что я использую, чтобы открыть это.

00:04:03.035 --> 00:04:05.960
Здесь, у нас есть все
информация, которую вы могли бы

00:04:05.960 --> 00:04:08.885
необходимость для того, чтобы поддерживать
ваш новый кластер больших данных,

00:04:08.885 --> 00:04:11.585
много команд Кубернете,
кластерной информации.

00:04:11.585 --> 00:04:13.565
Это то, что вы можете запустить,

00:04:13.565 --> 00:04:14.735
Вы можете отправить кому-то другому,

00:04:14.735 --> 00:04:17.065
и вы можете сохранить и
делать то, что вы хотите с.

00:04:17.065 --> 00:04:21.140
Так что мы очень рады, о
Ноутбуки в студии данных Azure.

00:04:21.140 --> 00:04:23.210
Мы действительно думаем, что это
это то, что будет

00:04:23.210 --> 00:04:26.210
очень полезно для нашего сообщества.

00:04:26.210 --> 00:04:28.040
Нам очень интересно
в выяснении того, как

00:04:28.040 --> 00:04:29.765
Вы используете его и
что вы хотите от нас.

00:04:29.765 --> 00:04:32.800
Так что если вы заинтересованы в
узнать больше, перейдите на GitHub,

00:04:32.800 --> 00:04:34.610
ищите студию данных Azure и вы

00:04:34.610 --> 00:04:37.120
может открыть функцию
запрос между ошибками.

00:04:37.120 --> 00:04:39.470
Это также, где вы
может скачать как

00:04:39.470 --> 00:04:51.991
стабильной и инсайдеров дополнение.
Большое вам спасибо за ваше время.

00:04:51.991 --> 00:04:57.040
(Музыка)

