WEBVTT

00:00:02.000 --> 00:00:05.040
>> Witam wszystkich i zapraszamy z powrotem do

00:00:05.040 --> 00:00:07.890
Wprowadzenie dla deweloperów
do nauki o danych.

00:00:07.890 --> 00:00:10.560
Uczenie maszynowe i AI do nauki o danych,

00:00:10.560 --> 00:00:14.250
mają kluczowe znaczenie, ale w jaki sposób
zaczynasz z nimi?

00:00:14.250 --> 00:00:16.110
W tym filmie nauczymy się

00:00:16.110 --> 00:00:18.660
czym jest cykl życia nauki o danych.

00:00:18.660 --> 00:00:22.560
Cykl życia jest przeznaczony do
projekty analityki danych, które są

00:00:22.560 --> 00:00:27.480
przeznaczone do kształtowania jako części
inteligentnych aplikacji.

00:00:27.480 --> 00:00:30.150
Cykl życia nauki o danych jest

00:00:30.150 --> 00:00:32.850
składa się z pięciu głównych
etapy, które są;

00:00:32.850 --> 00:00:36.540
zrozumienie biznesu, dane
nabywanie i rozumienie,

00:00:36.540 --> 00:00:40.110
modelowanie, wdrażanie,
i akceptacji klienta.

00:00:40.110 --> 00:00:43.245
Zacznijmy od
zrozumienia biznesowego.

00:00:43.245 --> 00:00:46.035
Tutaj są dwa główne cele.

00:00:46.035 --> 00:00:49.310
Pierwszy z nich dotyczy
określenie celów.

00:00:49.310 --> 00:00:50.570
Musisz pracować z

00:00:50.570 --> 00:00:53.540
klientów i innych
zainteresowane strony, aby zrozumieć,

00:00:53.540 --> 00:00:55.625
identyfikować problemy biznesowe.

00:00:55.625 --> 00:00:59.610
Drugim celem jest około
identyfikacji źródeł danych.

00:00:59.610 --> 00:01:02.600
Należy znaleźć odpowiednie
dane, które pomogą Ci odpowiedzieć

00:01:02.600 --> 00:01:04.310
pytanie, które definiuje

00:01:04.310 --> 00:01:07.310
celem państwa
projektu analityki danych.

00:01:07.310 --> 00:01:11.030
Następnie mamy dane
pozyskiwania i zrozumienia.

00:01:11.030 --> 00:01:15.800
Celem jest tutaj stworzenie
czysty, wysokiej jakości zestaw danych,

00:01:15.800 --> 00:01:18.425
oraz opracowanie
architektura rozwiązań

00:01:18.425 --> 00:01:22.375
potoku danych, który
odświeża i ocenia dane.

00:01:22.375 --> 00:01:24.090
Istnieją trzy główne etapy,

00:01:24.090 --> 00:01:26.280
jak widać. Połknieć dane.

00:01:26.280 --> 00:01:28.310
Tutaj musisz
połknąć dane do

00:01:28.310 --> 00:01:31.535
docelowe środowisko analityczne
że masz zamiar użyć,

00:01:31.535 --> 00:01:34.460
następnie trzeba zbadać
danych w celu ustalenia, czy

00:01:34.460 --> 00:01:37.340
jakość danych jest dobra
wystarczająco dużo, aby odpowiedzieć na to pytanie,

00:01:37.340 --> 00:01:39.230
i wreszcie, trzeba skonfigurować

00:01:39.230 --> 00:01:43.055
potok danych w celu zdobycia
nowych i odświeżyć dane.

00:01:43.055 --> 00:01:46.275
Po tym, nie ma
etapie modelowania.

00:01:46.275 --> 00:01:50.250
Głównym celem jest tutaj
inżynieria funkcji,

00:01:50.250 --> 00:01:52.550
musisz utworzyć
funkcje danych z

00:01:52.550 --> 00:01:55.250
surowych danych w celu ułatwienia
szkolenia modelarskiego.

00:01:55.250 --> 00:01:58.190
Model szkolenia, trzeba
aby znaleźć model, który

00:01:58.190 --> 00:02:01.390
odpowiedzieć na pytanie w
bardzo dokładny sposób,

00:02:01.390 --> 00:02:03.395
a także trzeba porównać

00:02:03.395 --> 00:02:05.780
różne wskaźniki sukcesu w celu

00:02:05.780 --> 00:02:08.420
zrozumieć, co jest najlepsze
modelu dla twojego rozwiązania,

00:02:08.420 --> 00:02:10.520
i wreszcie, należy określić, czy

00:02:10.520 --> 00:02:13.190
twój model jest odpowiedni
do produkcji,

00:02:13.190 --> 00:02:15.950
jest gotowy do wdrożenia.

00:02:15.950 --> 00:02:19.470
Na koniec istnieje wdrożenie.

00:02:19.470 --> 00:02:22.880
W tym miejscu musimy wdrożyć
modelu i rurociągu, aby

00:02:22.880 --> 00:02:26.360
środowisko produkcyjne
zużycia aplikacji.

00:02:26.360 --> 00:02:27.860
Aby wdrożyć modele,

00:02:27.860 --> 00:02:31.775
musisz je odsłonić
z otwartym interfejsem API.

00:02:31.775 --> 00:02:34.505
Interfejs umożliwia modelowi

00:02:34.505 --> 00:02:37.670
łatwo spożywane z różnych
rodzajów aplikacji.

00:02:37.670 --> 00:02:41.250
Niektóre przykłady z tych
aplikacja to strona internetowa,

00:02:41.250 --> 00:02:45.425
arkusz kalkulacyjny, pulpit nawigacyjny,
aplikacji zaplecza.

00:02:45.425 --> 00:02:50.405
Po tym, trzeba sfinalizować
nych w projekcie.

00:02:50.405 --> 00:02:53.480
Należy potwierdzić, że
rurociągu, modelu,

00:02:53.480 --> 00:02:56.925
i ich rozmieszczenia w
środowisko produkcyjne w celu zaspokojenia,

00:02:56.925 --> 00:03:01.345
oczywiście również twoi klienci
lub zainteresowanych stron.

00:03:01.345 --> 00:03:03.800
Możesz dowiedzieć się więcej o

00:03:03.800 --> 00:03:08.610
cyklu życia nauki o danych na poziomie
aka.ms/datasciencelifecycle.

