WEBVTT

00:00:02.180 --> 00:00:07.505
"> Vítejte zpět vývojářům
úvod do datové vědy.

00:00:07.505 --> 00:00:10.390
Nyní se dozvíme více
o tom, jak si můžete vybrat

00:00:10.390 --> 00:00:11.680
nejlepší model pro

00:00:11.680 --> 00:00:15.100
váš scénář datové vědy s
automatizovaného strojového učení.

00:00:15.100 --> 00:00:17.800
Pochopení
prediktivní síla sady

00:00:17.800 --> 00:00:20.420
vlastností s ohledem na
na závislou proměnnou,

00:00:20.420 --> 00:00:21.970
je velmi choulostivý problém,

00:00:21.970 --> 00:00:23.770
a že neexistuje univerzální metrický

00:00:23.770 --> 00:00:26.155
který vám může říct, jak to udělat.

00:00:26.155 --> 00:00:28.120
Takže odpověď na otázku,

00:00:28.120 --> 00:00:31.180
který algoritmus bych měl
použití je vždy, záleží.

00:00:31.180 --> 00:00:33.400
Záleží na velikosti, kvalitě,

00:00:33.400 --> 00:00:35.170
a povahu vašich údajů,

00:00:35.170 --> 00:00:39.205
záleží na tom, co chcete
s tím konkrétní odpovědí.

00:00:39.205 --> 00:00:41.650
A konečně, odpověď na otázku,

00:00:41.650 --> 00:00:45.119
které parametry bych měl použít
je také velmi náročná.

00:00:45.119 --> 00:00:47.090
Jak víte, hyperparametry jsou

00:00:47.090 --> 00:00:50.435
parametry vyšší úrovně
které se nelze naučit

00:00:50.435 --> 00:00:53.030
přímo z údajů pomocí

00:00:53.030 --> 00:00:56.215
gradientní sestup nebo jiné
optimalizační algoritmus.

00:00:56.215 --> 00:00:59.600
Popisují strukturální
informace o modelu, který

00:00:59.600 --> 00:01:03.380
musí být rozhodnuto před
parametry modelu.

00:01:03.380 --> 00:01:06.125
Nastavení parametrů modelu
a hledání před

00:01:06.125 --> 00:01:08.860
optimální parametry na základě

00:01:08.860 --> 00:01:13.065
učení a zkušenosti mohou
být také velmi časově náročné.

00:01:13.065 --> 00:01:16.085
Různé odhady
jsou vhodnější

00:01:16.085 --> 00:01:19.160
pro různé typy údajů
a také různé problémy.

00:01:19.160 --> 00:01:22.610
Tak často bych řekl, že
nejtěžší část řešení

00:01:22.610 --> 00:01:24.170
problém strojového učení může být

00:01:24.170 --> 00:01:27.175
nalezení správného
odhadce pro vaši práci.

00:01:27.175 --> 00:01:31.100
To je důvod, proč jsem velmi často používají
automatizované strojové učení,

00:01:31.100 --> 00:01:34.070
což je proces
automatizace časově náročného

00:01:34.070 --> 00:01:37.295
a iterativní úkol stroje
vývoj modelu učení.

00:01:37.295 --> 00:01:41.510
Automatizované strojové učení
bere v úvahu nejistotu,

00:01:41.510 --> 00:01:43.940
začlenění jejich
pravděpodobnostní model, aby

00:01:43.940 --> 00:01:47.090
určení nejlepších
potrubí a zkuste další.

00:01:47.090 --> 00:01:51.350
Tento přístup umožňuje
automatizované strojové učení

00:01:51.350 --> 00:01:55.925
prozkoumat nejslibnější
možnosti bez plýtvání časem.

00:01:55.925 --> 00:01:58.080
Nyní se podívejme blíže na

00:01:58.080 --> 00:02:01.790
různé automatizované
strojového učení.

00:02:01.790 --> 00:02:04.670
Za prvé, s automatizovanými
strojového učení, které je třeba

00:02:04.670 --> 00:02:08.255
identifikovat strojové učení
problém, který chcete vyřešit.

00:02:08.255 --> 00:02:11.914
Může se to zařazovat,
prognózy nebo regrese.

00:02:11.914 --> 00:02:14.060
Pak musíte zadat zdroj

00:02:14.060 --> 00:02:16.600
a formát
označených trénovacích dat.

00:02:16.600 --> 00:02:20.420
Tohle bude NumPy.
pole nebo Pandas DataFrame.

00:02:20.420 --> 00:02:22.640
Nakonec je třeba nakonfigurovat

00:02:22.640 --> 00:02:25.055
cíl počítače
pro modelové školení,

00:02:25.055 --> 00:02:27.064
například místní počítač,

00:02:27.064 --> 00:02:30.380
Strojové učení Azure
výpočetní, vzdálený virtuální počítač,

00:02:30.380 --> 00:02:32.825
naše Azure Databricks, například

00:02:32.825 --> 00:02:35.240
a během školení
Strojové učení Azure

00:02:35.240 --> 00:02:37.700
sloužit v podstatě k řadě

00:02:37.700 --> 00:02:42.635
imparallel potrubí, které se snaží
různých algoritmů a parametrů.

00:02:42.635 --> 00:02:45.140
Zastaví se až poté, co zasáhne

00:02:45.140 --> 00:02:49.345
výstupní kritéria, která jste
definovat v experimentu.

00:02:49.345 --> 00:02:54.330
Třída AutoMLConfig představuje
konfigurace pro odeslání

00:02:54.330 --> 00:02:56.500
automatizované strojové učení

00:02:56.500 --> 00:02:59.310
experiment v Azure Machine Learning.

00:02:59.310 --> 00:03:02.710
Tento konfigurační objekt
obsahuje a pokračuje

00:03:02.710 --> 00:03:06.245
parametry pro konfiguraci
experiment kolem,

00:03:06.245 --> 00:03:10.145
stejně jako údaje o školení, které
musí být použity za běhu.

00:03:10.145 --> 00:03:14.070
Další informace naleznete v tématu
aka.ms/AutoMLConfig-Class.

