WEBVTT

00:00:02.870 --> 00:00:07.590
>> 개발자에게 다시 오신 것을 환영합니다.
데이터 과학 소개.

00:00:07.590 --> 00:00:09.450
아마 여러분 중 많은 사람들이 이미

00:00:09.450 --> 00:00:12.120
전통에 익숙한
프로그래밍 논리.

00:00:12.120 --> 00:00:13.740
그래서 이해하려고 노력합시다

00:00:13.740 --> 00:00:15.360
활용도를 활용하는 기계 학습

00:00:15.360 --> 00:00:17.220
전통 프로그래밍 논리.

00:00:17.220 --> 00:00:18.640
이것은 그 이미지입니다.

00:00:18.640 --> 00:00:20.670
이는 방법에 대한 차이를 보여줍니다.

00:00:20.670 --> 00:00:24.580
전통 프로그래밍이 만들어집니다.
기계 학습 모델 과 비교됩니다.

00:00:24.580 --> 00:00:28.290
기존 프로그래밍 사용
심미적으로 프로그램 논리

00:00:28.290 --> 00:00:30.405
특정 출력을 가져옵니다.

00:00:30.405 --> 00:00:32.780
정적 결과를 기반으로 생성됩니다.

00:00:32.780 --> 00:00:35.075
알고리즘의 프로그램 논리입니다.

00:00:35.075 --> 00:00:37.130
기계 학습
구체적으로

00:00:37.130 --> 00:00:39.290
감독기계 학습에서,

00:00:39.290 --> 00:00:41.810
데이터가 있는 경우

00:00:41.810 --> 00:00:44.090
당신의 기능을 가지고

00:00:44.090 --> 00:00:47.005
레이블인 출력에서 해당됩니다.

00:00:47.005 --> 00:00:50.720
그것은
알고리즘 계산

00:00:50.720 --> 00:00:52.820
모델이 만들어지고,

00:00:52.820 --> 00:00:55.460
우리는 기본에 도달 할 수 있습니다
레벨 사용자 기능을 사용

00:00:55.460 --> 00:00:58.580
수학적 기능
데이터로 작성되었습니다.

00:00:58.580 --> 00:01:02.375
이를 교육이라고 합니다.
기계 학습 모델.

00:01:02.375 --> 00:01:06.710
기계 학습에서, 거기에
두 가지 범주는,

00:01:06.710 --> 00:01:09.470
하나는 감독 학습이라고합니다

00:01:09.470 --> 00:01:12.635
다른 하나는
감독되지 않은 학습.

00:01:12.635 --> 00:01:14.870
감독은 우리가 주는 것을 의미합니다.

00:01:14.870 --> 00:01:17.165
두 데이터의 예는

00:01:17.165 --> 00:01:19.280
예측 및 대답에 사용합니다.

00:01:19.280 --> 00:01:22.070
예를 들어, 개또는 고양이입니다.

00:01:22.070 --> 00:01:25.130
우리는
모델 태그 이미지의

00:01:25.130 --> 00:01:28.605
에 대한 기능 범주
개와 고양이를위한.

00:01:28.605 --> 00:01:32.445
우리는 그에게 말할 것입니다
고양이와 개는 무엇인가.

00:01:32.445 --> 00:01:36.600
그런 다음 모델은
제공된 데이터에 태그를 붙이는 방법.

00:01:36.600 --> 00:01:40.760
감독 학습은 우리가 할 때입니다
태그가 지정되지 않은 데이터 집합을

00:01:40.760 --> 00:01:42.635
그것을 주지 않고 에서 배울

00:01:42.635 --> 00:01:45.590
무엇의 대답
우리는 그것을 배우기를 원합니다.

00:01:45.590 --> 00:01:49.295
당신이 볼 수 있듯이, 아래
감독 된 기계 학습,

00:01:49.295 --> 00:01:52.460
두 가지 방법이 있습니다.
회귀 및 분류.

00:01:52.460 --> 00:01:55.235
감독되지 않은 상태에서
기계 학습,

00:01:55.235 --> 00:01:57.845
세 가지 다른 가 있습니다
방법: 클러스터링,

00:01:57.845 --> 00:02:00.905
변칙 검출,
그리고 추천.

00:02:00.905 --> 00:02:02.810
이제 우리는 약간의

00:02:02.810 --> 00:02:05.210
무엇의 이해
머신 러닝은

00:02:05.210 --> 00:02:08.825
모델을 살펴보겠습니다.
높은 수준의 건물 프로세스.

00:02:08.825 --> 00:02:11.540
당신이 볼 수 있듯이, 거기
4개의 주요 단계입니다.

00:02:11.540 --> 00:02:14.090
우리는 준비가 있다고 말했습니다.
데이터를 교육하고, 모델을 교육하고,

00:02:14.090 --> 00:02:17.600
모델을 테스트하고
모델을 작동합니다.

00:02:17.600 --> 00:02:18.875
데이터를 준비,

00:02:18.875 --> 00:02:21.305
그리고 이것은 당신이 찾아야 할 단계입니다.

00:02:21.305 --> 00:02:22.985
데이터를 선택하고 생성합니다.

00:02:22.985 --> 00:02:27.620
전처리 기술 적용
또한 데이터의 간격을 채웁니다.

00:02:27.620 --> 00:02:33.455
열차 모델은
당신은 당신의 모델을 제공해야

00:02:33.455 --> 00:02:36.590
특정 데이터를
모델은 그것을 배울 것입니다

00:02:36.590 --> 00:02:40.175
이러한 데이터에서 예측
미래에 뭔가로.

00:02:40.175 --> 00:02:43.010
이것은 매우 반복적인 작업입니다.

00:02:43.010 --> 00:02:45.990
모델의 데이터 변경

00:02:45.990 --> 00:02:48.560
당신이 생각하는 때까지 당신은 당신이 가지고 있다고 생각

00:02:48.560 --> 00:02:52.190
좋은 회계 데이터
제작 단계에 대한.

00:02:52.190 --> 00:02:54.020
테스트 모델, 지금 당신이

00:02:54.020 --> 00:02:57.200
당신이 생각하는 모델은
아주 잘 수행 할 것,

00:02:57.200 --> 00:02:59.800
테스트할 수 있습니다.
새 데이터를 계량합니다.

00:02:59.800 --> 00:03:01.980
마지막으로 모델을 작동합니다.

00:03:01.980 --> 00:03:05.030
이제 운영해야 할 때입니다.
모델이 되도록

00:03:05.030 --> 00:03:09.360
에서 그것을 소비 할 수 있습니다
다른 응용 프로그램.

