WEBVTT

00:00:02.870 --> 00:00:07.590
>> Bentornato agli sviluppatori
Introduzione all'analisi scientifica dei dati.

00:00:07.590 --> 00:00:09.450
Probabilmente molti di voi sono già

00:00:09.450 --> 00:00:12.120
familiarità con la tradizione
logica di programmazione.

00:00:12.120 --> 00:00:13.740
Quindi cerchiamo di capire

00:00:13.740 --> 00:00:15.360
l'apprendimento automatico nel sfruttare

00:00:15.360 --> 00:00:17.220
la logica di programmazione tradizionale.

00:00:17.220 --> 00:00:18.640
Questa è un'immagine di questo,

00:00:18.640 --> 00:00:20.670
che ti mostra la differenza in come

00:00:20.670 --> 00:00:24.580
la programmazione tradizionale è creata
rispetto a un modello di apprendimento automatico.

00:00:24.580 --> 00:00:28.290
Usi di programmazione tradizionali
esteticamente logica programma

00:00:28.290 --> 00:00:30.405
per ottenere le uscite specifiche.

00:00:30.405 --> 00:00:32.780
I risultati statici vengono generati in base

00:00:32.780 --> 00:00:35.075
la logica del programma nell'algoritmo.

00:00:35.075 --> 00:00:37.130
Il tuo apprendimento automatico
e in particolare

00:00:37.130 --> 00:00:39.290
in un apprendimento automatico supervisionato,

00:00:39.290 --> 00:00:41.810
avete i vostri dati che sono

00:00:41.810 --> 00:00:44.090
le tue caratteristiche e poi hai

00:00:44.090 --> 00:00:47.005
output che sono le etichette.

00:00:47.005 --> 00:00:50.720
Che passa attraverso il
calcolo algoritmo

00:00:50.720 --> 00:00:52.820
e il modello viene creato,

00:00:52.820 --> 00:00:55.460
siamo in grado di raggiungere alla base
livello di funzione utente utilizzando

00:00:55.460 --> 00:00:58.580
una funzione matematica
creati con i dati.

00:00:58.580 --> 00:01:02.375
Questo si chiama allenare il
modello di apprendimento automatico.

00:01:02.375 --> 00:01:06.710
Nell'apprendimento automatico,
sono due categorie diverse,

00:01:06.710 --> 00:01:09.470
uno si chiama apprendimento supervisionato

00:01:09.470 --> 00:01:12.635
e l'altro è
apprendimento senza supervisione.

00:01:12.635 --> 00:01:14.870
Supervisionato significa che stiamo dando

00:01:14.870 --> 00:01:17.165
gli esempi di entrambi i dati,

00:01:17.165 --> 00:01:19.280
utilizzarlo per prevedere e la risposta.

00:01:19.280 --> 00:01:22.070
Ad esempio, è un cane o è un gatto.

00:01:22.070 --> 00:01:25.130
Daremo il
immagine del tag del modello di

00:01:25.130 --> 00:01:28.605
una categoria di funzionalità per
cani e per i gatti.

00:01:28.605 --> 00:01:32.445
Gli avremmo detto
cos'è un gatto e un cane.

00:01:32.445 --> 00:01:36.600
Poi il modello imparerebbe
come taggare i dati forniti.

00:01:36.600 --> 00:01:40.760
Un apprendimento supervisionato è quando
assegnare un set di dati senza tag a

00:01:40.760 --> 00:01:42.635
imparare da senza darlo

00:01:42.635 --> 00:01:45.590
la risposta di ciò che
vogliamo che impari.

00:01:45.590 --> 00:01:49.295
Come potete vedere, sotto la
l'apprendimento automatico supervisionato,

00:01:49.295 --> 00:01:52.460
ci sono due metodi:
regressione e classificazione.

00:01:52.460 --> 00:01:55.235
Mentre sotto la supervisione
l'apprendimento automatico,

00:01:55.235 --> 00:01:57.845
ci sono tre diversi
metodi: clustering,

00:01:57.845 --> 00:02:00.905
rilevamento anomalie,
e raccomandazione.

00:02:00.905 --> 00:02:02.810
Ora che abbiamo un po 'di

00:02:02.810 --> 00:02:05.210
comprensione di ciò che
l'apprendimento automatico è,

00:02:05.210 --> 00:02:08.825
diamo un'occhiata al modello
processo di costruzione ad alto livello.

00:02:08.825 --> 00:02:11.540
Come potete vedere, ci sono
sono quattro fasi principali.

00:02:11.540 --> 00:02:14.090
Abbiamo detto che c'è una preparazione
i dati, eseguire il training del modello,

00:02:14.090 --> 00:02:17.600
testare il modello e
operativo il modello.

00:02:17.600 --> 00:02:18.875
A preparare i dati,

00:02:18.875 --> 00:02:21.305
e questa è una fase che dovete trovare,

00:02:21.305 --> 00:02:22.985
selezionare e creare un dato,

00:02:22.985 --> 00:02:27.620
applicazione di tecniche di pre-elaborazione
e anche colmare le lacune nei dati.

00:02:27.620 --> 00:02:33.455
Il modello di treno significa che
devi dare il tuo modello

00:02:33.455 --> 00:02:36.590
dati specifici in modo che il vostro
modello sta per imparare

00:02:36.590 --> 00:02:40.175
da questi dati per prevedere
come qualcosa in futuro.

00:02:40.175 --> 00:02:43.010
Questo è un compito molto iterativo

00:02:43.010 --> 00:02:45.990
perché potrebbe essere necessario
modificare i dati nel modello

00:02:45.990 --> 00:02:48.560
fino a quando si pensa di avere

00:02:48.560 --> 00:02:52.190
un buon dato contabile
per la fase di produzione.

00:02:52.190 --> 00:02:54.020
Modello di test, ora che si dispone di

00:02:54.020 --> 00:02:57.200
un modello che pensi sia
andando a eseguire molto bene,

00:02:57.200 --> 00:02:59.800
si può testare a
pesare i nuovi dati.

00:02:59.800 --> 00:03:01.980
Infine, rendere operativo il modello.

00:03:01.980 --> 00:03:05.030
Ora è il momento di rendere operativo
il vostro modello in modo che si

00:03:05.030 --> 00:03:09.360
può consumarlo da
diverse applicazioni.

