WEBVTT

00:00:02.180 --> 00:00:07.505
>> Witamy z powrotem dla programistów
wprowadzenie do nauki o danych.

00:00:07.505 --> 00:00:10.390
Teraz dowiedzmy się więcej
o tym, jak można wybrać

00:00:10.390 --> 00:00:11.680
najlepszy model dla

00:00:11.680 --> 00:00:15.100
scenariusz nauki o danych za pomocą
zautomatyzowanego uczenia maszynowego.

00:00:15.100 --> 00:00:17.800
Zrozumienie
predykcyjna moc zestawu

00:00:17.800 --> 00:00:20.420
funkcji z szacunkiem
do zmiennej zależnej,

00:00:20.420 --> 00:00:21.970
jest bardzo trudnym problemem,

00:00:21.970 --> 00:00:23.770
i że nie ma uniwersalnych wskaźników

00:00:23.770 --> 00:00:26.155
które mogą ci powiedzieć, jak to zrobić.

00:00:26.155 --> 00:00:28.120
Tak więc odpowiedź na to pytanie,

00:00:28.120 --> 00:00:31.180
który algorytm powinienem
użytkowania jest zawsze, to zależy.

00:00:31.180 --> 00:00:33.400
To zależy od wielkości, jakości,

00:00:33.400 --> 00:00:35.170
i charakter twoich danych,

00:00:35.170 --> 00:00:39.205
zależy od tego, co chcesz
z tą konkretną odpowiedzią.

00:00:39.205 --> 00:00:41.650
Wreszcie odpowiedź na to pytanie,

00:00:41.650 --> 00:00:45.119
jakich parametrów powinienem użyć
jest również bardzo trudne.

00:00:45.119 --> 00:00:47.090
Jak wiadomo, hiperparametry są

00:00:47.090 --> 00:00:50.435
parametry wyższego poziomu
których nie można się nauczyć

00:00:50.435 --> 00:00:53.030
bezpośrednio z danych za pomocą

00:00:53.030 --> 00:00:56.215
zejście gradientowe lub inne
algorytm optymalizacji.

00:00:56.215 --> 00:00:59.600
Opisują one strukturalne
informacje o modelu, który

00:00:59.600 --> 00:01:03.380
należy zdecydować przed
dopasowanie parametrów modelu.

00:01:03.380 --> 00:01:06.125
Ustawienie parametrów modelu
i wyszukiwanie przed

00:01:06.125 --> 00:01:08.860
optymalne wartości parametrów na podstawie

00:01:08.860 --> 00:01:13.065
uczenia się i doświadczenia mogą
być również bardzo czasochłonne.

00:01:13.065 --> 00:01:16.085
Różne estymatory
są lepiej dostosowane

00:01:16.085 --> 00:01:19.160
dla różnych typów danych
a także różne problemy.

00:01:19.160 --> 00:01:22.610
Tak często powtarzam, że
najtrudniejszą częścią rozwiązywania

00:01:22.610 --> 00:01:24.170
problem uczenia maszynowego może być

00:01:24.170 --> 00:01:27.175
znalezienie prawa
estymatora dla Twojej pracy.

00:01:27.175 --> 00:01:31.100
Dlatego bardzo często używam
zautomatyzowane uczenie maszynowe,

00:01:31.100 --> 00:01:34.070
który jest procesem
automatyzacja czasochłonnych

00:01:34.070 --> 00:01:37.295
i iteracyjnym zadaniem maszyny
rozwoju modelu uczenia się.

00:01:37.295 --> 00:01:41.510
Zautomatyzowane uczenie maszynowe
uwzględnia niepewność,

00:01:41.510 --> 00:01:43.940
włączenie ich
probabilistycznego modelu

00:01:43.940 --> 00:01:47.090
określenie najlepszych
potoku, aby spróbować dalej.

00:01:47.090 --> 00:01:51.350
Takie podejście pozwala na
zautomatyzowane uczenie maszynowe do

00:01:51.350 --> 00:01:55.925
odkrywanie najbardziej obiecujących
możliwości bez marnowania czasu.

00:01:55.925 --> 00:01:58.080
Teraz przyjrzyjmy się bliżej

00:01:58.080 --> 00:02:01.790
różnych zautomatyzowanych
uczenia maszynowego.

00:02:01.790 --> 00:02:04.670
Przede wszystkim dzięki zautomatyzowanym
uczenia maszynowego, które należy

00:02:04.670 --> 00:02:08.255
identyfikowanie uczenia maszynowego
problem, który chcesz rozwiązać.

00:02:08.255 --> 00:02:11.914
Mogą to być klasyfikacja,
prognozowania lub regresji.

00:02:11.914 --> 00:02:14.060
Następnie należy określić źródło

00:02:14.060 --> 00:02:16.600
oraz format
oznaczonych danych szkoleniowych.

00:02:16.600 --> 00:02:20.420
To będzie NumPy
tablice lub Pandas DataFrame.

00:02:20.420 --> 00:02:22.640
Na koniec należy skonfigurować

00:02:22.640 --> 00:02:25.055
cel komputera
do szkolenia modelek,

00:02:25.055 --> 00:02:27.064
takich jak komputer lokalny,

00:02:27.064 --> 00:02:30.380
Uczenie maszynowe platformy Azure
obliczeniowa, zdalna maszyna wirtualna,

00:02:30.380 --> 00:02:32.825
więc nasze usługi Azure Databricks, na przykład,

00:02:32.825 --> 00:02:35.240
a podczas szkolenia
Uczenie maszynowe platformy Azure

00:02:35.240 --> 00:02:37.700
służyć w zasadzie do wielu

00:02:37.700 --> 00:02:42.635
imparallel rurociągów, które próbują
różnych algorytmów i parametrów.

00:02:42.635 --> 00:02:45.140
Zatrzyma się tylko wtedy, gdy uderzy

00:02:45.140 --> 00:02:49.345
kryteria wyjścia, które
zdefiniowane w eksperymencie.

00:02:49.345 --> 00:02:54.330
Klasa AutoMLConfig reprezentuje
konfiguracja przesyłania

00:02:54.330 --> 00:02:56.500
automatyczne uczenie maszynowe

00:02:56.500 --> 00:02:59.310
eksperymentu w usłudze Azure Machine Learning.

00:02:59.310 --> 00:03:02.710
Ten obiekt konfiguracyjny
zawiera i przechodzi do

00:03:02.710 --> 00:03:06.245
parametry konfiguracji
eksperyment wokół,

00:03:06.245 --> 00:03:10.145
jak również dane szkoleniowe, które
musi być używany w czasie wykonywania.

00:03:10.145 --> 00:03:14.070
Aby dowiedzieć się więcej, zobacz
aka.ms/AutoMLConfig-Class.

