WEBVTT

00:00:00.000 --> 00:00:02.610
>> Il est enfin temps de
jouer avec nos données.

00:00:02.610 --> 00:00:04.830
J’ai un fichier CSV local avec tous les

00:00:04.830 --> 00:00:08.235
mes données et je dois m’assurer
que cela monte dans le Nuage.

00:00:08.235 --> 00:00:10.740
En outre, j’ai besoin
pour préparer mes données.

00:00:10.740 --> 00:00:12.750
Je sais que ce que je veux faire, c’est

00:00:12.750 --> 00:00:15.865
prédire combien de vélos
être loués un certain jour.

00:00:15.865 --> 00:00:19.770
Ce qui signifie que je dois préparer mon
données pour les prévisions d’une série temporelle.

00:00:19.770 --> 00:00:22.790
Comme toujours, il y a
documents supplémentaires sur

00:00:22.790 --> 00:00:26.350
l’écran, puis une description
en bas. Allons-y.

00:00:26.350 --> 00:00:30.750
Tout d’abord, je dois m’assurer
mon jeu de données est accessible.

00:00:31.600 --> 00:00:33.980
Je vais l’ajouter
dans le même dossier

00:00:33.980 --> 00:00:36.420
que mon carnet Jupyter est po

00:00:36.880 --> 00:00:40.174
Je vais télécharger ce jeu de données

00:00:40.174 --> 00:00:42.955
à mon apprentissage automatique
Datastore sur Azure.

00:00:42.955 --> 00:00:45.355
Je vais prendre mon fichier CSV,

00:00:45.355 --> 00:00:47.825
le télécharger dans le dossier du jeu de données,

00:00:47.825 --> 00:00:50.900
remplacer toutes les données
qui existe déjà,

00:00:50.900 --> 00:00:53.000
et je veux montrer les progrès de

00:00:53.000 --> 00:00:56.045
ce processus au sein de
Code Visual Studio.

00:00:56.045 --> 00:00:58.640
Super, on dirait que ça a marché.

00:00:58.640 --> 00:01:03.010
Ensuite, j’ai besoin de créer
un objet de jeu de données,

00:01:03.010 --> 00:01:06.910
qui est une classe de
azureml-core et j’ai besoin de

00:01:06.910 --> 00:01:08.935
formater ma date dans un
façon dont je vais le faire

00:01:08.935 --> 00:01:11.755
plus facile pour moi de trier mes données.

00:01:11.755 --> 00:01:15.050
J’ai besoin d’importer des cours.

00:01:15.250 --> 00:01:18.220
Maintenant, j’ai besoin de comprendre
quelle colonne je vais

00:01:18.220 --> 00:01:21.295
à utiliser pour prédire quelle autre colonne.

00:01:21.295 --> 00:01:22.855
Avant de décider de ça,

00:01:22.855 --> 00:01:25.210
Je vais ouvrir le fichier CSV

00:01:25.210 --> 00:01:27.970
et jetez un oeil à
les données que j’ai.

00:01:27.970 --> 00:01:30.685
J’ai remarqué qu’ici j’ai rendez-vous,

00:01:30.685 --> 00:01:34.540
saison, année, mois,
quel jour de la semaine,

00:01:34.540 --> 00:01:37.870
ce que le temps est, le
température, l’humidité,

00:01:37.870 --> 00:01:41.160
la vitesse du vent, et
J’ai aussi le compte,

00:01:41.160 --> 00:01:43.805
qui est le nombre de vélos
qui ont été loués.

00:01:43.805 --> 00:01:49.650
Je pense que ce que je vais faire, c’est que je vais
date d’utilisation pour prédire le nombre.

00:01:50.000 --> 00:01:52.710
Définissons ça ici.

00:01:52.710 --> 00:01:55.010
Maintenant, j’ai mon nom de colonne de temps,

00:01:55.010 --> 00:01:58.520
qui sera utilisé pour prédire
mon nom de colonne cible.

00:01:58.520 --> 00:02:00.890
Ensuite, je vais créer

00:02:00.890 --> 00:02:03.650
une variable locale appelée
jeu de données qui va garder

00:02:03.650 --> 00:02:05.570
suivi de mes données et je vais

00:02:05.570 --> 00:02:08.360
convertir ce jeu de données
dans un Pandas DataFrame.

00:02:08.360 --> 00:02:11.060
Remarquez que j’appelle prendre 5,

00:02:11.060 --> 00:02:14.630
qui imprimera le premier
cinq lignes de ce cadre de données.

00:02:14.630 --> 00:02:17.150
Nous pouvons vérifier que
ces lignes sont correctes.

00:02:17.150 --> 00:02:19.920
Nous sommes le 1er janvier 2011,

00:02:19.920 --> 00:02:23.605
la température était de 0,344167

00:02:23.605 --> 00:02:24.920
et nous pouvons jeter un oeil à

00:02:24.920 --> 00:02:28.200
notre fichier CSV et voir que
c’était encore le 1er janvier,

00:02:28.200 --> 00:02:36.440
2011, et que le temps était
ou la température était 0,33344167.

00:02:36.440 --> 00:02:39.620
Ça a l’air bien. Maintenant, nous
avoir un lien entre nos données

00:02:39.620 --> 00:02:43.890
stockés dans Azure et nos
Visual Studio Code.

