WEBVTT

00:00:03.200 --> 00:00:08.100
Добро пожаловать обратно к разработчикам
введение в науку о данных.

00:00:08.100 --> 00:00:12.510
Общий вопрос показывает, что
многие клиенты, разработчики,

00:00:12.510 --> 00:00:15.030
но также ученые, специалисты по обработке данных, спрашивают меня:

00:00:15.030 --> 00:00:18.690
какое машинное обучение
Алгоритм я должен использовать?

00:00:18.690 --> 00:00:24.465
Я всегда отвечаю, это зависит
по многим различным факторам.

00:00:24.465 --> 00:00:27.300
Но самое главное,
Алгоритм, который вы выбираете, зависит от

00:00:27.300 --> 00:00:30.750
по одному аспекту вашего
сценарий науки о данных.

00:00:30.750 --> 00:00:32.880
Что вы хотите
делать с вашими данными?

00:00:32.880 --> 00:00:36.515
Это самые важные вопросы
что вы должны спросить себя.

00:00:36.515 --> 00:00:39.200
В частности, другой
важным вопросом является:

00:00:39.200 --> 00:00:41.870
что такое бизнес
вопросы, которые вы хотите

00:00:41.870 --> 00:00:45.305
ответить, изучая
из ваших прошлых данных?

00:00:45.305 --> 00:00:48.679
Машинное обучение имеет много
различные алгоритмы,

00:00:48.679 --> 00:00:51.740
и каждый другой алгоритм
может помочь вам достичь

00:00:51.740 --> 00:00:55.200
другая цель и ответ
другой вопрос.

00:00:55.200 --> 00:00:57.615
Давайте посмотрим некоторые из них.

00:00:57.615 --> 00:01:01.755
Первый - это предсказание
между различными категориями.

00:01:01.755 --> 00:01:04.940
Здесь у нас есть два различных
методы,

00:01:04.940 --> 00:01:07.160
и у нас есть двухклассный
Классификации

00:01:07.160 --> 00:01:08.960
который отлично подходит для ответа

00:01:08.960 --> 00:01:12.315
вопрос, который
два выбора вопросов,

00:01:12.315 --> 00:01:15.150
как да или нет, правда или ложь.

00:01:15.150 --> 00:01:18.545
Тогда у нас есть
многоклассная классификация,

00:01:18.545 --> 00:01:21.110
который отлично подходит для ответа
сложные вопросы

00:01:21.110 --> 00:01:24.355
с несколькими возможными опциями.

00:01:24.355 --> 00:01:27.560
Вы также можете использовать машину
обучения на данных

00:01:27.560 --> 00:01:30.405
найти партнеров в ваших данных.

00:01:30.405 --> 00:01:32.450
Здесь у нас есть три различных типа

00:01:32.450 --> 00:01:34.805
метод, такой как рекомендатели,

00:01:34.805 --> 00:01:37.400
, которые велики в прогнозировании того, что

00:01:37.400 --> 00:01:40.220
кто-то будет заинтересован
в, в будущем.

00:01:40.220 --> 00:01:46.085
Кластеризация велика при разделении
аналогичные данные указывают на группы.

00:01:46.085 --> 00:01:50.030
Наконец, обнаружение аномалий,
который является большим в

00:01:50.030 --> 00:01:55.450
выявление и прогнозирование
редкие или необычные точки данных.

00:01:55.450 --> 00:01:58.715
Еще одна вещь, которую вы можете сделать
с вашими данными на самом деле

00:01:58.715 --> 00:02:02.405
понимание того, что
изображение представляет,

00:02:02.405 --> 00:02:05.045
а также понимание
естественного языка.

00:02:05.045 --> 00:02:08.960
Здесь у нас есть методы, такие
как классификация изображений,

00:02:08.960 --> 00:02:13.130
который способен определить
изображение с нейронными сетями.

00:02:13.130 --> 00:02:16.325
Также текстовая аналитика, которая способна

00:02:16.325 --> 00:02:20.660
получает высокое качество
информация из текста.

00:02:20.660 --> 00:02:23.150
Наконец, если вам нужно предсказать,

00:02:23.150 --> 00:02:26.285
результаты, основанные на
отношения между ценностями,

00:02:26.285 --> 00:02:29.930
вы можете использовать другой
метод регрессии типа.

00:02:29.930 --> 00:02:34.310
С регрессией, вы
как правило, делая прогноз по

00:02:34.310 --> 00:02:39.580
оценка отношений
между вашими ценностями.

00:02:39.580 --> 00:02:44.715
Для данного конкретного случая использования
что Сара пытается решить,

00:02:44.715 --> 00:02:46.980
Я думаю, что мы должны предсказать,

00:02:46.980 --> 00:02:50.395
сколько велосипедов будет
арендовали в течение следующего часа.

00:02:50.395 --> 00:02:53.660
Я действительно думаю, что
прогнозирование, самое главное,

00:02:53.660 --> 00:02:58.460
регрессия является правильным методом
что мы должны использовать, потому что мы

00:02:58.460 --> 00:03:00.620
действительно хочу предсказать результат

00:03:00.620 --> 00:03:04.290
на основе отношений
между значениями.

