WEBVTT

00:00:02.000 --> 00:00:05.040
"" Ahoj všichni, a vítejte zpět na

00:00:05.040 --> 00:00:07.890
Vývojáři Úvod
datové vědě.

00:00:07.890 --> 00:00:10.560
Strojové učení pro datové vědy a UI,

00:00:10.560 --> 00:00:14.250
jsou všechny kritické, ale jak může
začnete s nimi?

00:00:14.250 --> 00:00:16.110
V tomto videu se budeme učit

00:00:16.110 --> 00:00:18.660
jaký je životní cyklus datové vědy.

00:00:18.660 --> 00:00:22.560
Životní cyklus je určen pro
projekty datové vědy, které jsou

00:00:22.560 --> 00:00:27.480
určené k formování jako součást
inteligentních aplikací.

00:00:27.480 --> 00:00:30.150
Životní cyklus datové vědy je

00:00:30.150 --> 00:00:32.850
skládá se z pěti hlavních
etapy, které jsou;

00:00:32.850 --> 00:00:36.540
obchodní porozumění, data
získávání a porozumění,

00:00:36.540 --> 00:00:40.110
modelování, nasazení,
a přijetí zákazníkem.

00:00:40.110 --> 00:00:43.245
Začněme s
obchodní porozumění.

00:00:43.245 --> 00:00:46.035
Zde jsou dva hlavní cíle.

00:00:46.035 --> 00:00:49.310
První z nich je asi
vymezování cílů.

00:00:49.310 --> 00:00:50.570
Musíte pracovat s

00:00:50.570 --> 00:00:53.540
vaši zákazníci a další
zúčastněnými stranami, aby

00:00:53.540 --> 00:00:55.625
identifikovat obchodní problémy.

00:00:55.625 --> 00:00:59.610
Druhý cíl je o
identifikaci zdrojů údajů.

00:00:59.610 --> 00:01:02.600
Musíte najít relevantní
data, která vám pomohou odpovědět

00:01:02.600 --> 00:01:04.310
otázka, která vymezuje

00:01:04.310 --> 00:01:07.310
cílem vašeho
projektu datové vědy.

00:01:07.310 --> 00:01:11.030
Poté máme k dispozici údaje
získávání a porozumění.

00:01:11.030 --> 00:01:15.800
Cílem je dosáhnout
čistý, vysoce kvalitní datový soubor,

00:01:15.800 --> 00:01:18.425
a rozvíjet
architektura řešení

00:01:18.425 --> 00:01:22.375
datový kanál, který
aktualizuje a skóruje vaše data.

00:01:22.375 --> 00:01:24.090
Existují tři hlavní kroky,

00:01:24.090 --> 00:01:26.280
jak můžete vidět. Ingestovat data.

00:01:26.280 --> 00:01:28.310
Zde je třeba
ingestujte data do

00:01:28.310 --> 00:01:31.535
cílové analytické prostředí
že budete používat,

00:01:31.535 --> 00:01:34.460
pak musíte prozkoumat
údaje k určení, zda

00:01:34.460 --> 00:01:37.340
kvalita dat je dobrá
dost odpovědět na otázku,

00:01:37.340 --> 00:01:39.230
a nakonec je třeba nastavit

00:01:39.230 --> 00:01:43.055
datový kanál pro skóre
a aktualizovat data.

00:01:43.055 --> 00:01:46.275
Poté je
modelingu.

00:01:46.275 --> 00:01:50.250
Zde je hlavním cílem
funkce inženýrství,

00:01:50.250 --> 00:01:52.550
musíte vytvořit
datové funkce z

00:01:52.550 --> 00:01:55.250
nezpracovaných údajů, které usnadní
modelového tréninku.

00:01:55.250 --> 00:01:58.190
Model školení, které potřebujete
najít model, který

00:01:58.190 --> 00:02:01.390
odpovědět na otázku
velmi přesným způsobem,

00:02:01.390 --> 00:02:03.395
a také je třeba porovnat

00:02:03.395 --> 00:02:05.780
různých metrik úspěšnosti, aby se

00:02:05.780 --> 00:02:08.420
pochopit, co je nejlepší
model pro vaše řešení,

00:02:08.420 --> 00:02:10.520
a nakonec je třeba určit, zda

00:02:10.520 --> 00:02:13.190
váš model je vhodný
pro výrobu,

00:02:13.190 --> 00:02:15.950
připraven k nasazení.

00:02:15.950 --> 00:02:19.470
Konečně je nasazení.

00:02:19.470 --> 00:02:22.880
Zde musíme nasadit
modelu a potrubí, aby

00:02:22.880 --> 00:02:26.360
výrobní prostředí
spotřeby aplikací.

00:02:26.360 --> 00:02:27.860
Chcete-li nasadit své modely,

00:02:27.860 --> 00:02:31.775
musíte je vystavit
s otevřeným rozhraním API.

00:02:31.775 --> 00:02:34.505
Rozhraní umožňuje model být

00:02:34.505 --> 00:02:37.670
snadno konzumovány z různých
typy aplikací.

00:02:37.670 --> 00:02:41.250
Některé příklady těchto
aplikace jsou on-line webové stránky,

00:02:41.250 --> 00:02:45.425
tabulkový procesor, řídicí panel,
back-endových aplikací.

00:02:45.425 --> 00:02:50.405
Poté je třeba dokončit
výstupy vašeho projektu.

00:02:50.405 --> 00:02:53.480
Musíte potvrdit, že
potrubí, model,

00:02:53.480 --> 00:02:56.925
a jejich nasazení v
výrobní prostředí, aby uspokojilo,

00:02:56.925 --> 00:03:01.345
samozřejmě i vaši zákazníci
nebo zúčastněných stran.

00:03:01.345 --> 00:03:03.800
Můžete se dozvědět více o

00:03:03.800 --> 00:03:08.610
životního cyklu datové vědy na
aka.ms/datasciencelifecycle.

