WEBVTT

00:00:03.200 --> 00:00:08.100
>> Bienvenue aux développeurs
introduction à la science des données.

00:00:08.100 --> 00:00:12.510
Une question commune montre que
de nombreux clients, développeurs,

00:00:12.510 --> 00:00:15.030
mais aussi les scientifiques de données me demandent est,

00:00:15.030 --> 00:00:18.690
quel apprentissage automatique
algorithme dois-je utiliser?

00:00:18.690 --> 00:00:24.465
Je réponds toujours, cela dépend
sur de nombreux facteurs différents.

00:00:24.465 --> 00:00:27.300
Mais surtout, le
algorithme que vous sélectionnez dépend

00:00:27.300 --> 00:00:30.750
sur un aspect de votre
scénario de la science des données.

00:00:30.750 --> 00:00:32.880
Que voulez-vous
faire avec vos données?

00:00:32.880 --> 00:00:36.515
C’est la question la plus importante
que vous devriez vous demander.

00:00:36.515 --> 00:00:39.200
Plus précisément, un autre
question importante est,

00:00:39.200 --> 00:00:41.870
qu’est-ce que l’entreprise
questions que vous voulez

00:00:41.870 --> 00:00:45.305
répondre en apprenant
à partir de vos données passées?

00:00:45.305 --> 00:00:48.679
L’apprentissage automatique a de nombreux
différents algorithmes,

00:00:48.679 --> 00:00:51.740
et chaque algorithme différent
peut vous aider à atteindre

00:00:51.740 --> 00:00:55.200
un objectif et une réponse différents
une question différente.

00:00:55.200 --> 00:00:57.615
Voyons quelques-uns de ces.

00:00:57.615 --> 00:01:01.755
Le premier est de prédire
entre différentes catégories.

00:01:01.755 --> 00:01:04.940
Ici, nous avons deux différents
types de méthodes,

00:01:04.940 --> 00:01:07.160
et nous avons les deux classes
Classification

00:01:07.160 --> 00:01:08.960
qui est grand à répondre

00:01:08.960 --> 00:01:12.315
question qui sont
questions à deux choix,

00:01:12.315 --> 00:01:15.150
comme oui ou non, vrai ou faux.

00:01:15.150 --> 00:01:18.545
Ensuite, nous avons le
classification multiclasse,

00:01:18.545 --> 00:01:21.110
qui est grand à répondre
questions complexes

00:01:21.110 --> 00:01:24.355
avec plusieurs options possibles.

00:01:24.355 --> 00:01:27.560
Vous pouvez également utiliser la machine
apprendre sur vos données à

00:01:27.560 --> 00:01:30.405
découvrir des partenaires dans vos données.

00:01:30.405 --> 00:01:32.450
Ici, nous avons trois types différents de

00:01:32.450 --> 00:01:34.805
méthode telle qu’un recommendeurs,

00:01:34.805 --> 00:01:37.400
qui sont grands à prédire ce que

00:01:37.400 --> 00:01:40.220
quelqu’un sera intéressé
dans, à l’avenir.

00:01:40.220 --> 00:01:46.085
Le regroupement est excellent pour séparer
points de données similaires en groupes.

00:01:46.085 --> 00:01:50.030
Enfin, la détection d’anomalies,
ce qui est génial à

00:01:50.030 --> 00:01:55.450
identifier et prédire
points de données rares ou inhabituels.

00:01:55.450 --> 00:01:58.715
Une autre chose que vous pouvez faire
avec vos données est en fait

00:01:58.715 --> 00:02:02.405
comprendre ce que
l’image est présente,

00:02:02.405 --> 00:02:05.045
et aussi comprendre
le langage naturel.

00:02:05.045 --> 00:02:08.960
Ici, nous avons des méthodes telles que
comme classification d’image,

00:02:08.960 --> 00:02:13.130
qui est capable d’identifier
image avec un réseau neuronal.

00:02:13.130 --> 00:02:16.325
Aussi l’analyse de texte, qui est en mesure de

00:02:16.325 --> 00:02:20.660
tire de haute qualité
informations à partir du texte.

00:02:20.660 --> 00:02:23.150
Enfin, si vous avez besoin de prédire

00:02:23.150 --> 00:02:26.285
les résultats basés sur le
relation entre les valeurs,

00:02:26.285 --> 00:02:29.930
vous pouvez utiliser un autre
type de méthode de régression.

00:02:29.930 --> 00:02:34.310
Avec la régression, vous êtes
généralement faire des prévisions par

00:02:34.310 --> 00:02:39.580
estimation de la relation
entre vos valeurs.

00:02:39.580 --> 00:02:44.715
Pour ce cas d’utilisation spécifique
que Sara essaie de résoudre,

00:02:44.715 --> 00:02:46.980
Je pense que nous devons prédire

00:02:46.980 --> 00:02:50.395
combien de vélos seront
loué dans l’heure suivante.

00:02:50.395 --> 00:02:53.660
Je pense vraiment que le
prédiction, le plus important,

00:02:53.660 --> 00:02:58.460
la régression est la bonne méthode
que nous devrions utiliser parce que nous

00:02:58.460 --> 00:03:00.620
vraiment envie de prédire un résultat

00:03:00.620 --> 00:03:04.290
basé sur la relation
entre les valeurs.

