WEBVTT

00:00:03.200 --> 00:00:08.100
>> Bentornato agli sviluppatori
introduzione all'analisi scientifica dei dati.

00:00:08.100 --> 00:00:12.510
Una domanda comune mostra che
molti clienti, sviluppatori,

00:00:12.510 --> 00:00:15.030
ma anche i dati che gli scienziati mi chiedono sono:

00:00:15.030 --> 00:00:18.690
che l'apprendimento automatico
algoritmo che devo usare?

00:00:18.690 --> 00:00:24.465
Rispondo sempre, dipende
su molti fattori diversi.

00:00:24.465 --> 00:00:27.300
Ma, cosa più importante, il
algoritmo selezionato dipende

00:00:27.300 --> 00:00:30.750
su un aspetto del vostro
uno scenario di data science.

00:00:30.750 --> 00:00:32.880
Cosa vuoi
fare con i tuoi dati?

00:00:32.880 --> 00:00:36.515
Questa è la domanda più importante
che dovresti chiederti.

00:00:36.515 --> 00:00:39.200
In particolare, un altro
domanda importante è:

00:00:39.200 --> 00:00:41.870
qual è il business
domande che si desidera

00:00:41.870 --> 00:00:45.305
rispondere imparando
dai tuoi dati passati?

00:00:45.305 --> 00:00:48.679
L'apprendimento automatico ha molti
diversi algoritmi,

00:00:48.679 --> 00:00:51.740
e ogni algoritmo diverso
può aiutarti a raggiungere

00:00:51.740 --> 00:00:55.200
un obiettivo diverso e la risposta
una domanda diversa.

00:00:55.200 --> 00:00:57.615
Vediamo alcuni di questi.

00:00:57.615 --> 00:01:01.755
Il primo è prevedere
tra le diverse categorie.

00:01:01.755 --> 00:01:04.940
Qui abbiamo due diversi
tipi di metodi,

00:01:04.940 --> 00:01:07.160
e abbiamo la due classi
Classificazione

00:01:07.160 --> 00:01:08.960
che è grande a rispondere

00:01:08.960 --> 00:01:12.315
domanda che sono
domande a due scelte,

00:01:12.315 --> 00:01:15.150
come sì o no, vero o falso.

00:01:15.150 --> 00:01:18.545
Poi abbiamo il
classificazione multiclasse,

00:01:18.545 --> 00:01:21.110
che è grande a rispondere
domande complesse

00:01:21.110 --> 00:01:24.355
con più opzioni possibili.

00:01:24.355 --> 00:01:27.560
È inoltre possibile utilizzare
imparare sui tuoi dati per

00:01:27.560 --> 00:01:30.405
individuare i partner nei tuoi dati.

00:01:30.405 --> 00:01:32.450
Qui abbiamo tre diversi tipi di

00:01:32.450 --> 00:01:34.805
come un raccomandatore,

00:01:34.805 --> 00:01:37.400
che sono grandi a prevedere ciò che

00:01:37.400 --> 00:01:40.220
qualcuno sarà interessato
in, in futuro.

00:01:40.220 --> 00:01:46.085
Il clustering è ottimo per separare
punti dati simili in gruppi.

00:01:46.085 --> 00:01:50.030
Infine, il rilevamento delle anomalie,
che è grande a

00:01:50.030 --> 00:01:55.450
identificazione e previsione
punti dati rari o insoliti.

00:01:55.450 --> 00:01:58.715
Un'altra cosa che puoi fare
con i vostri dati è in realtà

00:01:58.715 --> 00:02:02.405
capire che cosa
l'immagine è presente,

00:02:02.405 --> 00:02:05.045
e anche la comprensione
il linguaggio naturale.

00:02:05.045 --> 00:02:08.960
Qui abbiamo metodi come
come classificazione delle immagini,

00:02:08.960 --> 00:02:13.130
che è in grado di identificare
un'immagine con una rete neurale.

00:02:13.130 --> 00:02:16.325
Anche l'analisi del testo, che è in grado di

00:02:16.325 --> 00:02:20.660
deriva di alta qualità
informazioni dal testo.

00:02:20.660 --> 00:02:23.150
Infine, se è necessario prevedere

00:02:23.150 --> 00:02:26.285
risultati basati sulla base
relazione tra i valori,

00:02:26.285 --> 00:02:29.930
è possibile utilizzare un diverso
tipo di metodo di regressione.

00:02:29.930 --> 00:02:34.310
Con la regressione, sei
generalmente facendo previsioni da

00:02:34.310 --> 00:02:39.580
stima della relazione
tra i tuoi valori.

00:02:39.580 --> 00:02:44.715
Per questo caso d'uso specifico
che Sara sta cercando di risolvere,

00:02:44.715 --> 00:02:46.980
Penso che dobbiamo prevedere

00:02:46.980 --> 00:02:50.395
quante biciclette saranno
affittato nell'ora successiva.

00:02:50.395 --> 00:02:53.660
Penso davvero che il
previsione, soprattutto,

00:02:53.660 --> 00:02:58.460
regressione è il metodo giusto
che dovremmo usare perché

00:02:58.460 --> 00:03:00.620
davvero vogliono prevedere un risultato

00:03:00.620 --> 00:03:04.290
in base alla relazione
tra i valori.

