WEBVTT

00:00:02.870 --> 00:00:07.590
>> Witamy z powrotem dla programistów
Wprowadzenie do nauki o danych.

00:00:07.590 --> 00:00:09.450
Prawdopodobnie wielu z was jest już

00:00:09.450 --> 00:00:12.120
zaznajomieni z tradycją
logiki programowania.

00:00:12.120 --> 00:00:13.740
Więc spróbujmy zrozumieć

00:00:13.740 --> 00:00:15.360
uczenia maszynowego w wykorzystaniu

00:00:15.360 --> 00:00:17.220
logiki programowania tradycji.

00:00:17.220 --> 00:00:18.640
To jest obraz tego,

00:00:18.640 --> 00:00:20.670
który pokazuje różnicę w sposobie

00:00:20.670 --> 00:00:24.580
programowanie tradycja jest tworzony
w porównaniu z modelem uczenia maszynowego.

00:00:24.580 --> 00:00:28.290
Tradycyjne zastosowania programowania
estetycznie zaprogramować logikę

00:00:28.290 --> 00:00:30.405
, aby uzyskać konkretne dane wyjściowe.

00:00:30.405 --> 00:00:32.780
Wyniki statyczne są generowane na podstawie

00:00:32.780 --> 00:00:35.075
logiki programu w algorytmie.

00:00:35.075 --> 00:00:37.130
Uczenie maszynowe
a w szczególności

00:00:37.130 --> 00:00:39.290
w nadzorowanym uczeniu maszynowym,

00:00:39.290 --> 00:00:41.810
posiadasz swoje dane, które są

00:00:41.810 --> 00:00:44.090
funkcji, a następnie masz

00:00:44.090 --> 00:00:47.005
w produktach, które są twoimi etykietami.

00:00:47.005 --> 00:00:50.720
To przechodzi przez
obliczanie algorytmu

00:00:50.720 --> 00:00:52.820
i model jest tworzony,

00:00:52.820 --> 00:00:55.460
możemy dotrzeć do podstawowych
poziom funkcji użytkownika za pomocą

00:00:55.460 --> 00:00:58.580
funkcja matematyczna
utworzone za pomocą danych.

00:00:58.580 --> 00:01:02.375
To się nazywa szkolenie
modelu uczenia maszynowego.

00:01:02.375 --> 00:01:06.710
W uczeniu maszynowym
to dwie różne kategorie,

00:01:06.710 --> 00:01:09.470
jeden nazywa się nadzorowanym uczeniem się

00:01:09.470 --> 00:01:12.635
a drugi jest
uczenia się bez nadzoru.

00:01:12.635 --> 00:01:14.870
Nadzorowane oznacza, że dajemy

00:01:14.870 --> 00:01:17.165
przykłady obu danych,

00:01:17.165 --> 00:01:19.280
używać go do przewidywania i odpowiedzi.

00:01:19.280 --> 00:01:22.070
Na przykład jest to pies lub kot.

00:01:22.070 --> 00:01:25.130
Będziemy udzielać
obraz znacznika modelu

00:01:25.130 --> 00:01:28.605
kategorię funkcji dla
psów i kotów.

00:01:28.605 --> 00:01:32.445
Powiedzielibyśmy mu, że
co to jest kot i pies.

00:01:32.445 --> 00:01:36.600
Następnie model będzie uczyć się
jak oznaczyć dostarczone dane.

00:01:36.600 --> 00:01:40.760
Nadzorowana nauka jest wtedy, gdy
nieoznakowany zestaw danych, aby

00:01:40.760 --> 00:01:42.635
uczyć się od nie dając mu

00:01:42.635 --> 00:01:45.590
odpowiedź na pytanie, co
chcemy, aby się tego nauczyła.

00:01:45.590 --> 00:01:49.295
Jak widać, pod
nadzorowane uczenie maszynowe,

00:01:49.295 --> 00:01:52.460
istnieją dwie metody:
regresji i klasyfikacji.

00:01:52.460 --> 00:01:55.235
Pod nienadzorowanym
uczenie maszynowe,

00:01:55.235 --> 00:01:57.845
istnieją trzy różne
metody: klastrowanie,

00:01:57.845 --> 00:02:00.905
wykrywanie anomalii,
i zalecenia.

00:02:00.905 --> 00:02:02.810
Teraz, gdy mamy trochę

00:02:02.810 --> 00:02:05.210
zrozumienie tego, co
uczenie maszynowe jest,

00:02:05.210 --> 00:02:08.825
spójrzmy na model
procesu budowlanego na wysokim poziomie.

00:02:08.825 --> 00:02:11.540
Jak widać, nie
są cztery główne etapy.

00:02:11.540 --> 00:02:14.090
Powiedzieliśmy, że jest
swoje dane, trenuj swój model,

00:02:14.090 --> 00:02:17.600
przetestować swój model, i
operationalize modelu.

00:02:17.600 --> 00:02:18.875
Przygotuj swoje dane,

00:02:18.875 --> 00:02:21.305
i jest to etap, który musisz znaleźć,

00:02:21.305 --> 00:02:22.985
wybrać i utworzyć dane,

00:02:22.985 --> 00:02:27.620
stosowanie technik przetwarzania wstępnego
a także wypełnić luki w danych.

00:02:27.620 --> 00:02:33.455
Model pociągu oznacza, że
musisz podać swój model

00:02:33.455 --> 00:02:36.590
konkretnych danych, tak aby
model będzie się go uczyć

00:02:36.590 --> 00:02:40.175
z tych danych, aby przewidzieć
jak coś w przyszłości.

00:02:40.175 --> 00:02:43.010
Jest to bardzo iteracyjny zadanie

00:02:43.010 --> 00:02:45.990
ponieważ może być konieczne
zmienianie danych w modelu

00:02:45.990 --> 00:02:48.560
dopóki nie pomyślisz, że

00:02:48.560 --> 00:02:52.190
dobre dane księgowe
na etapie produkcji.

00:02:52.190 --> 00:02:54.020
Model testowy, teraz, gdy masz

00:02:54.020 --> 00:02:57.200
model, który uważasz za model, który jest
będzie działać bardzo dobrze,

00:02:57.200 --> 00:02:59.800
można go przetestować, aby
zważyć nowe dane.

00:02:59.800 --> 00:03:01.980
Na koniec operacjonalizacja modelu.

00:03:01.980 --> 00:03:05.030
Teraz nadszedł czas, aby operationalize
modelu, tak aby

00:03:05.030 --> 00:03:09.360
może spożywać go z
różnych zastosowań.

