WEBVTT

00:00:02.870 --> 00:00:07.590
"> Vítejte zpět ve vývojáři
Úvod do datové vědy.

00:00:07.590 --> 00:00:09.450
Pravděpodobně mnozí z vás jsou již

00:00:09.450 --> 00:00:12.120
obeznámeni s tradicí
programovací logiku.

00:00:12.120 --> 00:00:13.740
Tak se pokusme pochopit,

00:00:13.740 --> 00:00:15.360
strojového učení ve s využitím

00:00:15.360 --> 00:00:17.220
tradiční programovací logiku.

00:00:17.220 --> 00:00:18.640
Tohle je obraz toho,

00:00:18.640 --> 00:00:20.670
který ukazuje rozdíl v tom, jak

00:00:20.670 --> 00:00:24.580
tradice programování je vytvořen
oproti modelu strojového učení.

00:00:24.580 --> 00:00:28.290
Tradiční programování používá
esteticky programová logika

00:00:28.290 --> 00:00:30.405
získat konkrétní výstupy.

00:00:30.405 --> 00:00:32.780
Statické výsledky jsou generovány na základě

00:00:32.780 --> 00:00:35.075
programovou logiku v algoritmu.

00:00:35.075 --> 00:00:37.130
Vaše strojové učení
a konkrétně

00:00:37.130 --> 00:00:39.290
strojového učení pod dohledem,

00:00:39.290 --> 00:00:41.810
máte svá data, která jsou

00:00:41.810 --> 00:00:44.090
vaše funkce a pak máte

00:00:44.090 --> 00:00:47.005
ve výstupech, které jsou vašimi štítky.

00:00:47.005 --> 00:00:50.720
To prochází
výpočet algoritmu

00:00:50.720 --> 00:00:52.820
a model je vytvořen,

00:00:52.820 --> 00:00:55.460
můžeme dosáhnout na základní
úroveň uživatelské funkce pomocí

00:00:55.460 --> 00:00:58.580
matematická funkce
vytvořené s daty.

00:00:58.580 --> 00:01:02.375
Tomu se říká školení
modelu strojového učení.

00:01:02.375 --> 00:01:06.710
Ve strojovém učení
jsou dvě různé kategorie,

00:01:06.710 --> 00:01:09.470
jeden se nazývá učení pod dohledem

00:01:09.470 --> 00:01:12.635
a ten druhý je
učení bez dozoru.

00:01:12.635 --> 00:01:14.870
Pod dohledem znamená, že dáváme

00:01:14.870 --> 00:01:17.165
příklady obou údajů,

00:01:17.165 --> 00:01:19.280
použijte jej k předvídání a odpověď.

00:01:19.280 --> 00:01:22.070
Například, je pes nebo je kočka.

00:01:22.070 --> 00:01:25.130
Budeme dávat
obrázek značky modelu

00:01:25.130 --> 00:01:28.605
kategorie funkcí pro
psů a koček.

00:01:28.605 --> 00:01:32.445
Řekli jsme mu to.
co je kočka a pes.

00:01:32.445 --> 00:01:36.600
Pak by se model naučil
jak označit poskytnuté údaje.

00:01:36.600 --> 00:01:40.760
Učení pod dohledem je, když jsme
poskytnout neocitovanému datovému souboru

00:01:40.760 --> 00:01:42.635
učit se od aniž by to

00:01:42.635 --> 00:01:45.590
odpověď na to, co
chceme, aby se to naučilo.

00:01:45.590 --> 00:01:49.295
Jak můžete vidět, pod
strojového učení pod dohledem,

00:01:49.295 --> 00:01:52.460
Existují dvě metody:
regrese a klasifikace.

00:01:52.460 --> 00:01:55.235
Zatímco pod bez dozoru
strojového učení,

00:01:55.235 --> 00:01:57.845
existují tři různé
metody: shlukování,

00:01:57.845 --> 00:02:00.905
detekce anomálií,
a doporučení.

00:02:00.905 --> 00:02:02.810
Nyní, když máme trochu

00:02:02.810 --> 00:02:05.210
pochopení toho, co
strojového učení je

00:02:05.210 --> 00:02:08.825
Podívejme se na model
stavebního procesu na vysoké úrovni.

00:02:08.825 --> 00:02:11.540
Jak můžete vidět, tam
jsou čtyři hlavní fáze.

00:02:11.540 --> 00:02:14.090
Řekli jsme, že je připraven
vaše data, trénování modelu,

00:02:14.090 --> 00:02:17.600
otestujte svůj model a
zprovoznění modelu.

00:02:17.600 --> 00:02:18.875
Připravte si data,

00:02:18.875 --> 00:02:21.305
a tohle je fáze, kterou musíš najít.

00:02:21.305 --> 00:02:22.985
vybrat a vytvořit data,

00:02:22.985 --> 00:02:27.620
použití technik předběžného zpracování
a také vyplňte mezery ve vašich datech.

00:02:27.620 --> 00:02:33.455
Model vlaku znamená, že
musíte dát svůj model

00:02:33.455 --> 00:02:36.590
konkrétní údaje tak, aby vaše
model se to naučí

00:02:36.590 --> 00:02:40.175
z těchto údajů předpovědět
jako něco v budoucnu.

00:02:40.175 --> 00:02:43.010
Jedná se o velmi iterativní úkol

00:02:43.010 --> 00:02:45.990
protože možná budete muset
změna dat v modelu

00:02:45.990 --> 00:02:48.560
dokud si nemyslíte, že jste

00:02:48.560 --> 00:02:52.190
dobré účetní údaje
pro fázi výroby.

00:02:52.190 --> 00:02:54.020
Testovací model, nyní, když máte

00:02:54.020 --> 00:02:57.200
model, o kterých si myslíte, že je
Bude to hrát velmi dobře,

00:02:57.200 --> 00:02:59.800
můžete jej otestovat, abyste
nové údaje.

00:02:59.800 --> 00:03:01.980
Nakonec zprovozněte model.

00:03:01.980 --> 00:03:05.030
Nyní je čas na zprovoznění
modelu tak, abyste

00:03:05.030 --> 00:03:09.360
může konzumovat z
různých aplikacích.

