WEBVTT

00:00:02.180 --> 00:00:07.505
Добро пожаловать обратно к разработчикам
введение в data Science.

00:00:07.505 --> 00:00:10.390
Теперь давайте узнаем больше
о том, как вы можете выбрать

00:00:10.390 --> 00:00:11.680
лучшая модель для

00:00:11.680 --> 00:00:15.100
ваш сценарий науки данных с
автоматизированное машинное обучение.

00:00:15.100 --> 00:00:17.800
Понимание
прогностической мощности набора

00:00:17.800 --> 00:00:20.420
особенностей с уважением
к зависимой переменной,

00:00:20.420 --> 00:00:21.970
это очень сложная проблема,

00:00:21.970 --> 00:00:23.770
и что нет универсальной метрики

00:00:23.770 --> 00:00:26.155
которые могут сказать вам, как это сделать.

00:00:26.155 --> 00:00:28.120
Итак, ответ на вопрос,

00:00:28.120 --> 00:00:31.180
какой алгоритм я должен
использование всегда, это зависит.

00:00:31.180 --> 00:00:33.400
Это зависит от размера, качества,

00:00:33.400 --> 00:00:35.170
и характер ваших данных,

00:00:35.170 --> 00:00:39.205
это зависит от того, что вы хотите
делать с этим конкретным ответом.

00:00:39.205 --> 00:00:41.650
Наконец, ответ на вопрос,

00:00:41.650 --> 00:00:45.119
какие параметры я должен использовать
также является очень сложной задачей.

00:00:45.119 --> 00:00:47.090
Как вы знаете, гиперпарамеры

00:00:47.090 --> 00:00:50.435
параметры более высокого уровня
которые не могут быть изучены

00:00:50.435 --> 00:00:53.030
непосредственно из данных, использующих

00:00:53.030 --> 00:00:56.215
градиентный спуск или другой
алгоритм оптимизации.

00:00:56.215 --> 00:00:59.600
Они описывают структурные
информация о модели,

00:00:59.600 --> 00:01:03.380
должны быть решены до
установки параметров модели.

00:01:03.380 --> 00:01:06.125
Настройка параметров модели
и поиск до

00:01:06.125 --> 00:01:08.860
оптимальные значения параметров, основанные на

00:01:08.860 --> 00:01:13.065
обучение и опыт могут
также очень много времени.

00:01:13.065 --> 00:01:16.085
Различные оценщики
лучше подходят

00:01:16.085 --> 00:01:19.160
для различных типов данных
а также различные проблемы.

00:01:19.160 --> 00:01:22.610
Так часто я бы сказал, что
самая трудная часть решения

00:01:22.610 --> 00:01:24.170
проблема машинного обучения может быть

00:01:24.170 --> 00:01:27.175
найти правильный
оценщика для вашей работы.

00:01:27.175 --> 00:01:31.100
Вот почему я очень часто использую
автоматизированное машинное обучение,

00:01:31.100 --> 00:01:34.070
который является процессом
автоматизация времени

00:01:34.070 --> 00:01:37.295
и итеративная задача машины
развитие модели обучения.

00:01:37.295 --> 00:01:41.510
Автоматизированное машинное обучение
принимает во внимание неопределенность,

00:01:41.510 --> 00:01:43.940
включение их
вероятностная модель

00:01:43.940 --> 00:01:47.090
определения лучших
трубопровод, чтобы попробовать следующий.

00:01:47.090 --> 00:01:51.350
Такой подход позволяет
автоматизированное машинное обучение

00:01:51.350 --> 00:01:55.925
исследовать наиболее перспективных
возможности, не теряя времени.

00:01:55.925 --> 00:01:58.080
Теперь, давайте более подробно рассмотрим

00:01:58.080 --> 00:02:01.790
различные автоматизированные
возможности машинного обучения.

00:02:01.790 --> 00:02:04.670
Прежде всего, с автоматизированной
машинное обучение, необходимое для

00:02:04.670 --> 00:02:08.255
определить машинное обучение
проблема, которую вы хотите решить.

00:02:08.255 --> 00:02:11.914
Это может быть классификация,
прогнозирование или регрессия.

00:02:11.914 --> 00:02:14.060
Затем вы должны указать источник

00:02:14.060 --> 00:02:16.600
и формат
помеченные данные обучения.

00:02:16.600 --> 00:02:20.420
Это будет NumPy
массивы или Пандаs DataFrame.

00:02:20.420 --> 00:02:22.640
Наконец, необходимо настроить

00:02:22.640 --> 00:02:25.055
компьютерная цель
для обучения модели,

00:02:25.055 --> 00:02:27.064
например, ваш местный компьютер,

00:02:27.064 --> 00:02:30.380
Машинное обучение Azure
вычислить, удаленный VM,

00:02:30.380 --> 00:02:32.825
так что наши Azure Databricks, например,

00:02:32.825 --> 00:02:35.240
и во время обучения
Лазурное машинное обучение

00:02:35.240 --> 00:02:37.700
служить в основном ряду

00:02:37.700 --> 00:02:42.635
импаралл трубопроводы, которые пытаются
различных алгоритмов и параметров.

00:02:42.635 --> 00:02:45.140
Он остановится только после того, как он попадает

00:02:45.140 --> 00:02:49.345
критерии выхода, которые вы
определить в эксперименте.

00:02:49.345 --> 00:02:54.330
Класс AutoMLConfig представляет
конфигурация для отправки

00:02:54.330 --> 00:02:56.500
автоматизированное машинное обучение

00:02:56.500 --> 00:02:59.310
эксперимент в Лазурном автоматном обучении.

00:02:59.310 --> 00:03:02.710
Этот объект конфигурации
содержит и переходит к

00:03:02.710 --> 00:03:06.245
параметры настройки
эксперимент вокруг,

00:03:06.245 --> 00:03:10.145
а также данные обучения, которые
необходимо использовать во время выполнения.

00:03:10.145 --> 00:03:14.070
Чтобы узнать больше, пожалуйста, посмотрите
aka.ms/AutoMLConfig-Class.

