WEBVTT

00:00:02.000 --> 00:00:05.040
>> 안녕 모두, 그리고 다시 오신 것을 환영합니다

00:00:05.040 --> 00:00:07.890
개발자 소개
데이터 과학에.

00:00:07.890 --> 00:00:10.560
데이터 과학 기계 학습 및 AI,

00:00:10.560 --> 00:00:14.250
모두 중요하지만 어떻게 할 수 있습니까?
당신은 그들과 함께 시작?

00:00:14.250 --> 00:00:16.110
이 비디오에서는

00:00:16.110 --> 00:00:18.660
데이터 과학 수명 주기가 무엇인지.

00:00:18.660 --> 00:00:22.560
수명 주기는
데이터 과학 프로젝트

00:00:22.560 --> 00:00:27.480
의 일부로 모양을 하기위한
지능형 응용 프로그램.

00:00:27.480 --> 00:00:30.150
데이터 과학 수명 주기는

00:00:30.150 --> 00:00:32.850
5개의 전공으로 구성됨
단계는;

00:00:32.850 --> 00:00:36.540
비즈니스 이해, 데이터
인수 및 이해,

00:00:36.540 --> 00:00:40.110
모델링, 배포,
고객 수용.

00:00:40.110 --> 00:00:43.245
시작해
비즈니스 이해.

00:00:43.245 --> 00:00:46.035
여기에 두 가지 주요 목표가 있습니다.

00:00:46.035 --> 00:00:49.310
첫 번째는
목표를 정의합니다.

00:00:49.310 --> 00:00:50.570
함께 작업해야 합니다.

00:00:50.570 --> 00:00:53.540
고객 및 기타
stakeholders to understand,

00:00:53.540 --> 00:00:55.625
비즈니스 문제를 식별합니다.

00:00:55.625 --> 00:00:59.610
두 번째 목표는
데이터 원본을 식별합니다.

00:00:59.610 --> 00:01:02.600
관련 을 찾아야 합니다.
답변하는 데 도움이 되는 데이터

00:01:02.600 --> 00:01:04.310
정의하는 질문

00:01:04.310 --> 00:01:07.310
귀하의 목적
데이터 과학 프로젝트.

00:01:07.310 --> 00:01:11.030
그 후 데이터가 있습니다.
인수 및 이해.

00:01:11.030 --> 00:01:15.800
여기서 목표는 생산하는 것입니다.
깨끗하고 고품질의 데이터 집합은

00:01:15.800 --> 00:01:18.425
솔루션 아키텍처

00:01:18.425 --> 00:01:22.375
데이터 파이프라인
데이터를 새로 고치고 점수를 줍니다.

00:01:22.375 --> 00:01:24.090
세 가지 주요 단계가 있습니다.

00:01:24.090 --> 00:01:26.280
당신이 볼 수 있듯이. 데이터를 수집합니다.

00:01:26.280 --> 00:01:28.310
여기서
데이터를 수집하여

00:01:28.310 --> 00:01:31.535
대상 분석 환경
사용하려는 경우,

00:01:31.535 --> 00:01:34.460
그런 다음 탐색해야 합니다.
데이터를 결정합니다.

00:01:34.460 --> 00:01:37.340
데이터 품질이 양호합니다.
질문에 대답하기에 충분합니다.

00:01:37.340 --> 00:01:39.230
마지막으로, 설정해야 합니다.

00:01:39.230 --> 00:01:43.055
점수를 매기는 데이터 파이프라인
데이터를 새로 새로 고칩니다.

00:01:43.055 --> 00:01:46.275
이 후에는
모델링 스테이지입니다.

00:01:46.275 --> 00:01:50.250
주요 목표는 다음과 같습니다.
기능 엔지니어링,

00:01:50.250 --> 00:01:52.550
데이터 기능

00:01:52.550 --> 00:01:55.250
용이한 원시 데이터
모델 교육.

00:01:55.250 --> 00:01:58.190
모델 교육, 당신은 필요
모델을 찾으려면

00:01:58.190 --> 00:02:01.390
질문에 대한 답변
매우 정확한 방법,

00:02:01.390 --> 00:02:03.395
또한 비교해야 합니다.

00:02:03.395 --> 00:02:05.780
다른 성공 지표를

00:02:05.780 --> 00:02:08.420
무엇이 최고인지 이해
솔루션에 대한 모델,

00:02:08.420 --> 00:02:10.520
마지막으로, 당신은 여부를 결정해야합니다

00:02:10.520 --> 00:02:13.190
모델이 적합합니다.
생산을 위해,

00:02:13.190 --> 00:02:15.950
배포할 준비가 되었습니다.

00:02:15.950 --> 00:02:19.470
마지막으로 배포가 있습니다.

00:02:19.470 --> 00:02:22.880
여기서 는
모델 및 파이프라인은

00:02:22.880 --> 00:02:26.360
응용 프로그램 소비.

00:02:26.360 --> 00:02:27.860
모델을 배포하려면

00:02:27.860 --> 00:02:31.775
당신은 그들을 노출해야합니다
개방형 API 인터페이스를 사용합니다.

00:02:31.775 --> 00:02:34.505
인터페이스를 통해 모델은

00:02:34.505 --> 00:02:37.670
다른 곳에서 쉽게 섭취할 수 있습니다.
응용 프로그램의 유형입니다.

00:02:37.670 --> 00:02:41.250
이러한 몇 가지 예
응용 프로그램은 온라인 웹 사이트입니다,

00:02:41.250 --> 00:02:45.425
스프레드시트, 대시보드,
백 엔드 응용 프로그램.

00:02:45.425 --> 00:02:50.405
이 후에는 완료해야 합니다.
프로젝트 결과물.

00:02:50.405 --> 00:02:53.480
확인해야 합니다.
파이프라인, 모델,

00:02:53.480 --> 00:02:56.925
만족시킬 수 있는 생산 환경,

00:02:56.925 --> 00:03:01.345
물론 고객도
또는 이해 관계자의 목표.

00:03:01.345 --> 00:03:03.800
자세한 내용은 확인할 수 있습니다.

00:03:03.800 --> 00:03:08.610
데이터 과학 수명 주기
aka.ms/datasciencelifecycle.

