WEBVTT

00:00:00.260 --> 00:00:03.735
>> La vita di data science
ciclo aveva un sacco di senso.

00:00:03.735 --> 00:00:05.400
Ora so che voglio definire

00:00:05.400 --> 00:00:08.235
il mio problema prima di fare qualsiasi altra cosa.

00:00:08.235 --> 00:00:11.310
Quindi la mia app è un'app basata sui servizi.

00:00:11.310 --> 00:00:14.205
Ciò significa che dipende
non solo sui dati di utilizzo,

00:00:14.205 --> 00:00:17.670
ma anche fattori esterni
come il tempo e la data.

00:00:17.670 --> 00:00:20.640
Ad esempio, il modo in cui le persone
noleggiare biciclette potrebbe

00:00:20.640 --> 00:00:24.150
guardare molto diverso su un
giorni lavorativi.

00:00:24.150 --> 00:00:25.740
So che voglio usare

00:00:25.740 --> 00:00:27.945
i dati anonimiche che
Ho raccolto la mia app,

00:00:27.945 --> 00:00:31.800
nonché i fattori esterni
come la data e il tempo per fare

00:00:31.800 --> 00:00:34.020
decisioni meglio informate su come

00:00:34.020 --> 00:00:37.065
e dove metto il mio
biciclette in giro per la città.

00:00:37.065 --> 00:00:39.480
So che questo
analisi iniziale che

00:00:39.480 --> 00:00:41.895
che facciamo oggi è solo il primo passo.

00:00:41.895 --> 00:00:43.940
Ho intenzione di prendere
quello che imparo e sono

00:00:43.940 --> 00:00:46.100
andando a migliorare quali dati ho

00:00:46.100 --> 00:00:48.290
raccogliere e quali domande ho

00:00:48.290 --> 00:00:51.920
chiedere in modo da poter essere più
successo nella mia app.

00:00:51.920 --> 00:00:54.455
Allora, che aspetto ha il successo per me?

00:00:54.455 --> 00:00:58.105
Beh, per me significa di più
persone che noleggiano biciclette.

00:00:58.105 --> 00:01:00.560
Ora potrei spendere molti più soldi per

00:01:00.560 --> 00:01:02.180
marketing, ma un altro modo per fare

00:01:02.180 --> 00:01:04.115
che è quello di assicurarsi
che il mio inventario,

00:01:04.115 --> 00:01:07.525
le mie biciclette, sono nel giusto
posto al momento giusto.

00:01:07.525 --> 00:01:09.800
Questa è una matrice piuttosto complessa,

00:01:09.800 --> 00:01:13.340
quindi cerchiamo di comporre verso il basso un
un po 'di più e concentrarsi su

00:01:13.340 --> 00:01:18.020
quante biciclette potrei aver bisogno in un
certa area nell'ora successiva,

00:01:18.020 --> 00:01:21.160
o un giorno, o anche pochi minuti.

00:01:21.160 --> 00:01:23.565
Quindi questa sarà la mia domanda.

00:01:23.565 --> 00:01:25.760
Voglio prevedere come
molte biciclette saranno

00:01:25.760 --> 00:01:28.595
affittato nella prossima ora
in un certo luogo,

00:01:28.595 --> 00:01:30.710
allora forse posso spostare il mio inventario a

00:01:30.710 --> 00:01:33.760
quell'area e altro ancora
biciclette saranno noleggiate.

00:01:33.760 --> 00:01:35.970
Così sembra che ho

00:01:35.970 --> 00:01:39.015
una buona comprensione della mia
comprensione aziendale.

00:01:39.015 --> 00:01:41.600
Non voglio davvero pasticciare
con i miei dati abbastanza ancora.

00:01:41.600 --> 00:01:43.610
Voglio fare un'analisi iniziale

00:01:43.610 --> 00:01:45.830
e la comprensione dei
quello che sta succedendo prima.

00:01:45.830 --> 00:01:48.340
Quindi il passo successivo è
sarà la modellazione.

00:01:48.340 --> 00:01:50.360
Quindi voglio provare a distribuire

00:01:50.360 --> 00:01:52.280
questo come un servizio web
perché voglio provarlo

00:01:52.280 --> 00:01:54.260
in natura e vedere se posso fare

00:01:54.260 --> 00:01:57.260
eventuali previsioni e
migliorare questo straordinario.

00:01:57.260 --> 00:01:59.120
Quindi cerchiamo di controllare di nuovo con

00:01:59.120 --> 00:02:01.010
Francesca in modo che possiamo
imparare un po 'di più

00:02:01.010 --> 00:02:03.230
sull'apprendimento automatico
modelli e forse trovare

00:02:03.230 --> 00:02:06.570
da quale dovremmo
utilizzare per il nostro problema.

