WEBVTT

00:00:02.000 --> 00:00:05.040
- Привет всем, и добро пожаловать обратно в

00:00:05.040 --> 00:00:07.890
Введение разработчиков
в Data Science.

00:00:07.890 --> 00:00:10.560
Машинное обучение и ИИ,

00:00:10.560 --> 00:00:14.250
все критические, но как можно
Вы начинаете с ними?

00:00:14.250 --> 00:00:16.110
В этом видео мы собираемся узнать,

00:00:16.110 --> 00:00:18.660
что такое жизненный цикл науки о данных.

00:00:18.660 --> 00:00:22.560
Жизненный цикл предназначен для
проекты в области науки о данных, которые

00:00:22.560 --> 00:00:27.480
предназначен для формирования в рамках
интеллектуальных приложений.

00:00:27.480 --> 00:00:30.150
Жизненный цикл науки о данных

00:00:30.150 --> 00:00:32.850
состоит из пяти основных
этапы, которые;

00:00:32.850 --> 00:00:36.540
бизнес-понимание, данные
приобретение и понимание,

00:00:36.540 --> 00:00:40.110
моделирование, развертывание,
и принятие клиентов.

00:00:40.110 --> 00:00:43.245
Начнем с
понимание бизнеса.

00:00:43.245 --> 00:00:46.035
Здесь есть две основные цели.

00:00:46.035 --> 00:00:49.310
Первый из них о
определения целей.

00:00:49.310 --> 00:00:50.570
Вы должны работать с

00:00:50.570 --> 00:00:53.540
ваших клиентов и других
заинтересованных сторон, чтобы понять,

00:00:53.540 --> 00:00:55.625
определить бизнес-проблемы.

00:00:55.625 --> 00:00:59.610
Вторая цель –
определения источников данных.

00:00:59.610 --> 00:01:02.600
Вы должны найти соответствующие
данные, которые помогают вам ответить

00:01:02.600 --> 00:01:04.310
вопрос, определяющий

00:01:04.310 --> 00:01:07.310
целью вашего
проект по науке о данных.

00:01:07.310 --> 00:01:11.030
После этого у нас есть данные
приобретения и понимания.

00:01:11.030 --> 00:01:15.800
Цели здесь должны производить
чистый, высококачественный набор данных,

00:01:15.800 --> 00:01:18.425
и разработать
архитектура решений

00:01:18.425 --> 00:01:22.375
конвейер данных,
обновляет и оценивает ваши данные.

00:01:22.375 --> 00:01:24.090
Есть три основных шага,

00:01:24.090 --> 00:01:26.280
как вы можете видеть. Ingest данные.

00:01:26.280 --> 00:01:28.310
Здесь вам нужно
проветь свои данные в

00:01:28.310 --> 00:01:31.535
целевая аналитическая среда
что вы собираетесь использовать,

00:01:31.535 --> 00:01:34.460
то вам нужно изучить
данные, чтобы определить,

00:01:34.460 --> 00:01:37.340
качество данных является хорошим
достаточно, чтобы ответить на вопрос,

00:01:37.340 --> 00:01:39.230
и, наконец, вам нужно настроить

00:01:39.230 --> 00:01:43.055
конвейер данных для оценки
новые и обновленные данные.

00:01:43.055 --> 00:01:46.275
После этого
стадии моделирования.

00:01:46.275 --> 00:01:50.250
Здесь главная цель
особенность инженерии,

00:01:50.250 --> 00:01:52.550
необходимо создать
особенности данных из

00:01:52.550 --> 00:01:55.250
необработанные данные для облегчения
обучение модели.

00:01:55.250 --> 00:01:58.190
Модельное обучение, вам нужно
чтобы найти модель, которая

00:01:58.190 --> 00:02:01.390
ответить на вопрос в
очень точный способ,

00:02:01.390 --> 00:02:03.395
а также вам нужно сравнить

00:02:03.395 --> 00:02:05.780
различные показатели успеха для того, чтобы

00:02:05.780 --> 00:02:08.420
понять, что лучше всего
модель для вашего решения,

00:02:08.420 --> 00:02:10.520
и, наконец, вы должны определить, если

00:02:10.520 --> 00:02:13.190
ваша модель подходит
для производства,

00:02:13.190 --> 00:02:15.950
готов к развертыванию.

00:02:15.950 --> 00:02:19.470
Наконец, есть развертывание.

00:02:19.470 --> 00:02:22.880
Здесь мы должны развернуть
модель и конвейер в

00:02:22.880 --> 00:02:26.360
производственной среды
потребления приложений.

00:02:26.360 --> 00:02:27.860
Для развертывания моделей

00:02:27.860 --> 00:02:31.775
Вы должны разоблачить их
с открытым интерфейсом API.

00:02:31.775 --> 00:02:34.505
Интерфейс позволяет модели

00:02:34.505 --> 00:02:37.670
легко потребляется из разных
типы приложений.

00:02:37.670 --> 00:02:41.250
Некоторые примеры из этих
приложение онлайн веб-сайт,

00:02:41.250 --> 00:02:45.425
электронная таблица, панель мониторинга,
бэк-энд приложений.

00:02:45.425 --> 00:02:50.405
После этого необходимо доработать
результаты проекта.

00:02:50.405 --> 00:02:53.480
Вы должны подтвердить, что
трубопровод, модель,

00:02:53.480 --> 00:02:56.925
и их развертывание в
условия производства для удовлетворения,

00:02:56.925 --> 00:03:01.345
конечно, также ваши клиенты
или цели заинтересованных сторон.

00:03:01.345 --> 00:03:03.800
Вы можете узнать больше о

00:03:03.800 --> 00:03:08.610
жизненного цикла науки о данных в
aka.ms/datasciencelifecycle.

