WEBVTT

00:00:03.200 --> 00:00:08.100
>> 개발자에게 다시 오신 것을 환영합니다.
데이터 과학 소개.

00:00:08.100 --> 00:00:12.510
일반적인 질문은
많은 고객, 개발자,

00:00:12.510 --> 00:00:15.030
그러나 또한 데이터 과학자들이 나에게 물어,

00:00:15.030 --> 00:00:18.690
어떤 기계 학습
알고리즘을 사용해야 하나요?

00:00:18.690 --> 00:00:24.465
나는 항상 대답, 그것은 따라 달라집니다
많은 다른 요인에.

00:00:24.465 --> 00:00:27.300
그러나 가장 중요한 것은,
선택한 알고리즘은

00:00:27.300 --> 00:00:30.750
당신의 한 측면에
데이터 과학 시나리오.

00:00:30.750 --> 00:00:32.880
당신은 무엇을 원하십니까
데이터로 수행합니까?

00:00:32.880 --> 00:00:36.515
이것은 가장 중요한 질문입니다.
스스로에게 물어봐야 합니다.

00:00:36.515 --> 00:00:39.200
특히, 다른
중요한 질문은,

00:00:39.200 --> 00:00:41.870
비즈니스란 무엇인가
원하는 질문

00:00:41.870 --> 00:00:45.305
학습으로 답변
과거 데이터에서?

00:00:45.305 --> 00:00:48.679
기계 학습에는 많은 것이 있습니다.
다른 알고리즘,

00:00:48.679 --> 00:00:51.740
각 다른 알고리즘
당신이 달성하는 데 도움이 될 수 있습니다

00:00:51.740 --> 00:00:55.200
다른 목표와 답변
다른 질문.

00:00:55.200 --> 00:00:57.615
이들 중 일부를 보자.

00:00:57.615 --> 00:01:01.755
첫 번째 예측
서로 다른 범주 사이.

00:01:01.755 --> 00:01:04.940
여기에 우리는 두 가지 다른
방법의 유형,

00:01:04.940 --> 00:01:07.160
우리는 두 클래스를 가지고
분류

00:01:07.160 --> 00:01:08.960
대답에 좋은

00:01:08.960 --> 00:01:12.315
질문입니다.
두 가지 선택 질문,

00:01:12.315 --> 00:01:15.150
예 또는 아니오처럼, 진실 또는 거짓.

00:01:15.150 --> 00:01:18.545
그런 다음 우리는
다중 클래스 분류,

00:01:18.545 --> 00:01:21.110
대답에 좋은
복잡한 질문

00:01:21.110 --> 00:01:24.355
여러 가지 가능한 옵션.

00:01:24.355 --> 00:01:27.560
또한 기계를 사용할 수 있습니다.
데이터에 대한 학습

00:01:27.560 --> 00:01:30.405
데이터에서 파트너를 찾아보십시오.

00:01:30.405 --> 00:01:32.450
여기에 우리는 세 가지 유형의

00:01:32.450 --> 00:01:34.805
추천자와 같은 방법,

00:01:34.805 --> 00:01:37.400
그것은 무엇을 예측에 좋은

00:01:37.400 --> 00:01:40.220
누군가가 관심을 가지게 될 것입니다.
에서, 미래에.

00:01:40.220 --> 00:01:46.085
클러스터링은 분리에 적합합니다.
그룹으로 유사한 데이터 포인트.

00:01:46.085 --> 00:01:50.030
마지막으로, 이상 감지,
좋은

00:01:50.030 --> 00:01:55.450
식별 및 예측
드물거나 특이한 데이터 포인트.

00:01:55.450 --> 00:01:58.715
할 수 있는 또 다른 일
데이터로 실제로

00:01:58.715 --> 00:02:02.405
무엇을 이해
이미지가 제시되고,

00:02:02.405 --> 00:02:05.045
또한 이해
자연어.

00:02:05.045 --> 00:02:08.960
여기서 우리는 그런 방법이 있습니다.
이미지 분류로서,

00:02:08.960 --> 00:02:13.130
식별할 수 있습니다.
신경망이 있는 이미지입니다.

00:02:13.130 --> 00:02:16.325
또한 텍스트 분석, 그 할 수 있습니다

00:02:16.325 --> 00:02:20.660
고품질 유래
텍스트의 정보입니다.

00:02:20.660 --> 00:02:23.150
마지막으로 예측해야 하는 경우

00:02:23.150 --> 00:02:26.285
결과에 기반한 결과는
값 간의 관계,

00:02:26.285 --> 00:02:29.930
다른 것을 사용할 수 있습니다.
회귀 방법의 유형입니다.

00:02:29.930 --> 00:02:34.310
회귀와 함께, 당신은
일반적으로

00:02:34.310 --> 00:02:39.580
관계 추정
값 사이.

00:02:39.580 --> 00:02:44.715
이 특정 사용 사례의 경우
사라가 해결하려고 하는 것을,

00:02:44.715 --> 00:02:46.980
나는 우리가 예측 할 필요가 있다고 생각합니다.

00:02:46.980 --> 00:02:50.395
얼마나 많은 자전거가 될 것인가
다음 시간에 임대.

00:02:50.395 --> 00:02:53.660
나는 정말로
예측, 가장 중요한 것은,

00:02:53.660 --> 00:02:58.460
회귀는 올바른 방법입니다.
우리가 사용해야 하는 것은 우리가 사용해야 하기 때문에

00:02:58.460 --> 00:03:00.620
결과를 예측하고 싶습니다.

00:03:00.620 --> 00:03:04.290
관계에 따라
값 사이를 볼 수 있습니다.

