WEBVTT

00:00:02.180 --> 00:00:07.505
>> 개발자에게 다시 오신 것을 환영합니다.
데이터 과학 소개.

00:00:07.505 --> 00:00:10.390
이제 자세히 알아봅시다.
선택할 수 있는 방법에 대해

00:00:10.390 --> 00:00:11.680
최고의 모델

00:00:11.680 --> 00:00:15.100
데이터 과학 시나리오
자동화 된 기계 학습.

00:00:15.100 --> 00:00:17.800
세트의 예측 전력

00:00:17.800 --> 00:00:20.420
존중하는 기능
종속 변수에 대해

00:00:20.420 --> 00:00:21.970
매우 까다로운 문제입니다.

00:00:21.970 --> 00:00:23.770
범용 메트릭이 없음

00:00:23.770 --> 00:00:26.155
그렇게하는 방법을 알 수 있습니다.

00:00:26.155 --> 00:00:28.120
그래서 질문에 대한 대답,

00:00:28.120 --> 00:00:31.180
어떤 알고리즘을 해야 합니까?
사용은 항상, 그것은 따라 달라집니다.

00:00:31.180 --> 00:00:33.400
크기, 품질에 따라 달라 집니다만,

00:00:33.400 --> 00:00:35.170
데이터의 특성,

00:00:35.170 --> 00:00:39.205
그것은 당신이 원하는 것에 따라 달라집니다
특정 답변으로 수행합니다.

00:00:39.205 --> 00:00:41.650
마지막으로, 질문에 대한 대답,

00:00:41.650 --> 00:00:45.119
사용해야 하는 매개 변수
또한 매우 도전적입니다.

00:00:45.119 --> 00:00:47.090
아시다시피 하이퍼파라미터는

00:00:47.090 --> 00:00:50.435
상위 수준 매개 변수
그것은 배울 수 없습니다

00:00:50.435 --> 00:00:53.030
사용 데이터에서 직접

00:00:53.030 --> 00:00:56.215
그라데이션 하강 또는 기타
최적화 알고리즘.

00:00:56.215 --> 00:00:59.600
그들은 구조에 대해 설명합니다.
모델에 대한 정보

00:00:59.600 --> 00:01:03.380
전에 결정해야 합니다.
모델 매개 변수를 피팅합니다.

00:01:03.380 --> 00:01:06.125
모델 매개 변수 설정
전에 검색

00:01:06.125 --> 00:01:08.860
에 따라 최적의 매개 변수 값

00:01:08.860 --> 00:01:13.065
학습 과 경험은 할 수
또한 매우 시간이 많이 소요됩니다.

00:01:13.065 --> 00:01:16.085
다른 추정기
더 적합

00:01:16.085 --> 00:01:19.160
다양한 유형의 데이터
또한 다른 문제.

00:01:19.160 --> 00:01:22.610
그래서 자주 나는 그것을 말할 것이다
해결의 가장 어려운 부분

00:01:22.610 --> 00:01:24.170
기계 학습 문제가

00:01:24.170 --> 00:01:27.175
오른쪽 찾기
작업에 대한 추정기입니다.

00:01:27.175 --> 00:01:31.100
그래서 저는 자주 사용하는 이유입니다.
자동화된 기계 학습,

00:01:31.100 --> 00:01:34.070
소요 시간 관리

00:01:34.070 --> 00:01:37.295
기계의 반복작업
학습 모델 개발.

00:01:37.295 --> 00:01:41.510
자동화된 기계 학습
불확실성을 고려하여,

00:01:41.510 --> 00:01:43.940
확률 모델

00:01:43.940 --> 00:01:47.090
최고의 결정
다음에 시도할 파이프라인입니다.

00:01:47.090 --> 00:01:51.350
이 방법을 통해
자동화된 기계 학습

00:01:51.350 --> 00:01:55.925
가장 유망한 탐험
시간을 낭비하지 않고 가능성.

00:01:55.925 --> 00:01:58.080
이제 자세히 살펴보겠습니다.

00:01:58.080 --> 00:02:01.790
다른 자동화
기계 학습 기능.

00:02:01.790 --> 00:02:04.670
우선, 자동화된
기계 학습을 수행해야 합니다.

00:02:04.670 --> 00:02:08.255
기계 학습 식별
해결하려는 문제.

00:02:08.255 --> 00:02:11.914
이러한 분류는 분류될 수 있으며,
예측, 또는 회귀.

00:02:11.914 --> 00:02:14.060
그런 다음 소스를 지정해야 합니다.

00:02:14.060 --> 00:02:16.600
그리고 의 형식은
레이블이 지정된 교육 데이터입니다.

00:02:16.600 --> 00:02:20.420
이것은 NumPy될 것입니다
배열 또는 팬더 데이터 프레임.

00:02:20.420 --> 00:02:22.640
마지막으로, 구성해야 합니다.

00:02:22.640 --> 00:02:25.055
컴퓨터 대상
모델 교육을 위해,

00:02:25.055 --> 00:02:27.064
로컬 컴퓨터와 같이

00:02:27.064 --> 00:02:30.380
Azure 머신 러닝
컴퓨팅, 원격 VM,

00:02:30.380 --> 00:02:32.825
예를 들어 Azure Databricks는 다음과 같은 경우

00:02:32.825 --> 00:02:35.240
및 훈련 중
Azure 기계 학습

00:02:35.240 --> 00:02:37.700
기본적으로 여러 가지에 봉사하십시오.

00:02:37.700 --> 00:02:42.635
시도하는 비교할 수 없는 파이프라인
다른 알고리즘 및 매개 변수.

00:02:42.635 --> 00:02:45.140
그것은 안타 한 번만 중지됩니다

00:02:45.140 --> 00:02:49.345
귀하가
실험에서 정의합니다.

00:02:49.345 --> 00:02:54.330
AutoMLConfig 클래스는
제출을 위한 구성

00:02:54.330 --> 00:02:56.500
자동화된 기계 학습

00:02:56.500 --> 00:02:59.310
Azure 기계 학습에서 실험할 수 있습니다.

00:02:59.310 --> 00:03:02.710
이 구성 개체
포함 및 진행

00:03:02.710 --> 00:03:06.245
구성을 위한 매개 변수
주변의 실험은

00:03:06.245 --> 00:03:10.145
교육 데이터뿐만 아니라
런타임에 사용해야 합니다.

00:03:10.145 --> 00:03:14.070
자세한 내용은
aka.ms/AutoMLConfig-Class.

