WEBVTT

00:00:02.870 --> 00:00:07.590
Добро пожаловать обратно к разработчикам
Введение в науку о данных.

00:00:07.590 --> 00:00:09.450
Наверное, многие из вас уже

00:00:09.450 --> 00:00:12.120
знакомы с традицией
логика программирования.

00:00:12.120 --> 00:00:13.740
Так что давайте попробуем понять

00:00:13.740 --> 00:00:15.360
машинное обучение в использовании

00:00:15.360 --> 00:00:17.220
логика программирования традиции.

00:00:17.220 --> 00:00:18.640
Это образ этого,

00:00:18.640 --> 00:00:20.670
что показывает вам разницу в том, как

00:00:20.670 --> 00:00:24.580
традиция программирования создается
по сравнению с моделью машинного обучения.

00:00:24.580 --> 00:00:28.290
Традиционное использование программирования
эстетически логика программы

00:00:28.290 --> 00:00:30.405
для получения конкретных результатов.

00:00:30.405 --> 00:00:32.780
Статические результаты генерируются на основе

00:00:32.780 --> 00:00:35.075
логика программы в алгоритме.

00:00:35.075 --> 00:00:37.130
Ваше машинное обучение
и конкретно

00:00:37.130 --> 00:00:39.290
в контролируемом машинном обучении,

00:00:39.290 --> 00:00:41.810
у вас есть данные, которые

00:00:41.810 --> 00:00:44.090
ваши функции, а затем у вас есть

00:00:44.090 --> 00:00:47.005
это в выводах, которые являются вашими этикетками.

00:00:47.005 --> 00:00:50.720
Это проходит через
алгоритм вычисления

00:00:50.720 --> 00:00:52.820
и модель создается,

00:00:52.820 --> 00:00:55.460
мы можем достичь в основных
функция пользователя уровня с помощью

00:00:55.460 --> 00:00:58.580
математическая функция
создан с данными.

00:00:58.580 --> 00:01:02.375
Это называется обучением
модель машинного обучения.

00:01:02.375 --> 00:01:06.710
В машинном обучении
две разные категории,

00:01:06.710 --> 00:01:09.470
один называется контролируемое обучение

00:01:09.470 --> 00:01:12.635
а другой
неконтролируемое обучение.

00:01:12.635 --> 00:01:14.870
Контролируемые означает, что мы даем

00:01:14.870 --> 00:01:17.165
примеры обоих данных,

00:01:17.165 --> 00:01:19.280
использовать его для прогнозирования и ответа.

00:01:19.280 --> 00:01:22.070
Например, это собака или кошка.

00:01:22.070 --> 00:01:25.130
Мы будем давать
модель тег изображение

00:01:25.130 --> 00:01:28.605
категория функций для
собак и для кошек.

00:01:28.605 --> 00:01:32.445
Мы бы сказали ему,
что такое кошка и собака.

00:01:32.445 --> 00:01:36.600
Тогда модель будет учиться
как пометить предоставленные данные.

00:01:36.600 --> 00:01:40.760
Контролируемое обучение – это когда мы
дать ему немаркированной набор данных

00:01:40.760 --> 00:01:42.635
учиться, не давая ему

00:01:42.635 --> 00:01:45.590
ответ на что
мы хотим, чтобы он узнал.

00:01:45.590 --> 00:01:49.295
Как вы можете видеть, под
контролируемое машинное обучение,

00:01:49.295 --> 00:01:52.460
Есть два метода:
регрессии и классификации.

00:01:52.460 --> 00:01:55.235
Находясь под неконтролируемым
машинное обучение,

00:01:55.235 --> 00:01:57.845
Есть три различных
методы: кластеризация,

00:01:57.845 --> 00:02:00.905
обнаружение аномалий,
и рекомендации.

00:02:00.905 --> 00:02:02.810
Теперь, когда у нас есть немного

00:02:02.810 --> 00:02:05.210
понимание того, что
машинное обучение,

00:02:05.210 --> 00:02:08.825
Давайте посмотрим на модель
процесс строительства на высоком уровне.

00:02:08.825 --> 00:02:11.540
Как вы можете видеть, есть
четыре основных этапа.

00:02:11.540 --> 00:02:14.090
Мы сказали, что есть подготовка
ваши данные, обучить модель,

00:02:14.090 --> 00:02:17.600
проверить свою модель, и
оперативния свою модель.

00:02:17.600 --> 00:02:18.875
Подготовка данных,

00:02:18.875 --> 00:02:21.305
и это этап, который вы должны найти,

00:02:21.305 --> 00:02:22.985
выбрать и создать данные,

00:02:22.985 --> 00:02:27.620
применение методов предварительной обработки
а также заполнить пробелы в ваших данных.

00:02:27.620 --> 00:02:33.455
Модель поезда означает, что
Вы должны дать вашей модели

00:02:33.455 --> 00:02:36.590
конкретные данные, так что
модель собирается узнать его

00:02:36.590 --> 00:02:40.175
из этих данных для прогнозирования
как что-то в будущем.

00:02:40.175 --> 00:02:43.010
Это очень итеративная задача

00:02:43.010 --> 00:02:45.990
потому что вам может понадобиться
изменить данные в модели

00:02:45.990 --> 00:02:48.560
пока вы думаете, что у вас есть

00:02:48.560 --> 00:02:52.190
хорошие бухгалтерские данные
для стадии производства.

00:02:52.190 --> 00:02:54.020
Тестовая модель, теперь, когда у вас есть

00:02:54.020 --> 00:02:57.200
модель, которая, по вашему мнению,
будет выполнять очень хорошо,

00:02:57.200 --> 00:02:59.800
вы можете проверить его, чтобы
взвешивают новые данные.

00:02:59.800 --> 00:03:01.980
Наконец, уализации модели.

00:03:01.980 --> 00:03:05.030
Теперь пришло время для оперативной
ваша модель так, что вы

00:03:05.030 --> 00:03:09.360
может потреблять его от
различных приложений.

