WEBVTT

00:00:02.180 --> 00:00:07.505
>> Bentornato agli sviluppatori
introduzione all'analisi scientifica dei dati.

00:00:07.505 --> 00:00:10.390
Ora, impariamo di più
su come si può scegliere

00:00:10.390 --> 00:00:11.680
il miglior modello per

00:00:11.680 --> 00:00:15.100
lo scenario di data science con
l'apprendimento automatico automatizzato.

00:00:15.100 --> 00:00:17.800
Comprendere il
potenza predittiva di un insieme

00:00:17.800 --> 00:00:20.420
di caratteristiche con rispetto
a una variabile dipendente,

00:00:20.420 --> 00:00:21.970
è un problema molto difficile,

00:00:21.970 --> 00:00:23.770
e che non esiste una metrica universale

00:00:23.770 --> 00:00:26.155
che può dirvi come farlo.

00:00:26.155 --> 00:00:28.120
Quindi la risposta alla domanda,

00:00:28.120 --> 00:00:31.180
quale algoritmo dovrei
uso è sempre, dipende.

00:00:31.180 --> 00:00:33.400
Dipende dalle dimensioni, dalla qualità,

00:00:33.400 --> 00:00:35.170
e la natura dei tuoi dati,

00:00:35.170 --> 00:00:39.205
dipende da ciò che si desidera
fare con quella risposta specifica.

00:00:39.205 --> 00:00:41.650
Infine, la risposta alla domanda,

00:00:41.650 --> 00:00:45.119
quali parametri dovrei usare
è anche molto impegnativo.

00:00:45.119 --> 00:00:47.090
Come sapete, gli iperparametri sono

00:00:47.090 --> 00:00:50.435
parametri di livello superiore
che non può essere appreso

00:00:50.435 --> 00:00:53.030
direttamente dai dati utilizzando

00:00:53.030 --> 00:00:56.215
discesa gradiente o altro
algoritmo di ottimizzazione.

00:00:56.215 --> 00:00:59.600
Essi descrivono le
informazioni su un modello che

00:00:59.600 --> 00:01:03.380
deve essere deciso prima
adattare i parametri di un modello.

00:01:03.380 --> 00:01:06.125
Impostazione dei parametri del modello
e la ricerca prima

00:01:06.125 --> 00:01:08.860
valori di parametri ottimali basati su

00:01:08.860 --> 00:01:13.065
l'apprendimento e l'esperienza possono
richiede molto tempo.

00:01:13.065 --> 00:01:16.085
Sstimatori diversi
sono più adatti

00:01:16.085 --> 00:01:19.160
per diversi tipi di dati
e anche diversi problemi.

00:01:19.160 --> 00:01:22.610
Così spesso direi che
la parte più difficile della risoluzione

00:01:22.610 --> 00:01:24.170
un problema di apprendimento automatico può essere

00:01:24.170 --> 00:01:27.175
trovare il giusto
estimatore per il tuo lavoro.

00:01:27.175 --> 00:01:31.100
Ecco perché uso molto spesso
apprendimento automatico automatizzato,

00:01:31.100 --> 00:01:34.070
che è il processo di
automatizzando il tempo che richiede tempo

00:01:34.070 --> 00:01:37.295
e compito iterativo della macchina
sviluppo del modello di apprendimento.

00:01:37.295 --> 00:01:41.510
Apprendimento automatico automatizzato
tiene conto dell'incertezza,

00:01:41.510 --> 00:01:43.940
incorporando la loro
modello probabilistico per

00:01:43.940 --> 00:01:47.090
determinare il meglio
pipeline per provare il prossimo.

00:01:47.090 --> 00:01:51.350
Questo approccio consente
l'apprendimento automatico automatizzato per

00:01:51.350 --> 00:01:55.925
esplorare i più promettenti
possibilità senza perdere tempo.

00:01:55.925 --> 00:01:58.080
Ora, diamo uno sguardo più da vicino di

00:01:58.080 --> 00:02:01.790
le diverse automatizzate
capacità di apprendimento automatico.

00:02:01.790 --> 00:02:04.670
Prima di tutto, con
l'apprendimento automatico è necessario

00:02:04.670 --> 00:02:08.255
identificare l'apprendimento automatico
problema che si desidera risolvere.

00:02:08.255 --> 00:02:11.914
Questi possono essere classificazione,
previsione o regressione.

00:02:11.914 --> 00:02:14.060
Quindi è necessario specificare l'origine

00:02:14.060 --> 00:02:16.600
e il formato del
dati di training etichettati.

00:02:16.600 --> 00:02:20.420
Questo sarà NumPy
matrici o un frame di dati Pandas.

00:02:20.420 --> 00:02:22.640
Infine, è necessario configurare

00:02:22.640 --> 00:02:25.055
l'obiettivo del computer
per il training del modello,

00:02:25.055 --> 00:02:27.064
come il computer locale,

00:02:27.064 --> 00:02:30.380
Apprendimento automatico di AzureAzure machine learning
elaborazione, VM remota,

00:02:30.380 --> 00:02:32.825
quindi i nostri Azure Databricks, per esempio,

00:02:32.825 --> 00:02:35.240
e durante la formazione il
Azure Machine Learning

00:02:35.240 --> 00:02:37.700
servono fondamentalmente a un certo numero di

00:02:37.700 --> 00:02:42.635
oleodotti imparallel che cercano
diversi algoritmi e parametri.

00:02:42.635 --> 00:02:45.140
Si fermerà solo una volta che colpisce

00:02:45.140 --> 00:02:49.345
i criteri di uscita che si
definire nell'esperimento.

00:02:49.345 --> 00:02:54.330
La classe AutoMLConfig rappresenta
una configurazione per l'invio

00:02:54.330 --> 00:02:56.500
un apprendimento automatico automatizzato

00:02:56.500 --> 00:02:59.310
esperimento in Azure Machine Learning.

00:02:59.310 --> 00:03:02.710
Questo oggetto di configurazione
contiene e procede a

00:03:02.710 --> 00:03:06.245
i parametri per la configurazione
l'esperimento intorno,

00:03:06.245 --> 00:03:10.145
così come i dati di training che
deve essere utilizzato in fase di esecuzione.

00:03:10.145 --> 00:03:14.070
Per saperne di più, si prega di consultare
aka.ms/AutoMLConfig-Class.

