WEBVTT

00:00:02.870 --> 00:00:07.590
>> Bienvenue aux développeurs
Introduction à la science des données.

00:00:07.590 --> 00:00:09.450
Probablement beaucoup d’entre vous sont déjà

00:00:09.450 --> 00:00:12.120
familier avec la tradition
logique de programmation.

00:00:12.120 --> 00:00:13.740
Essayons donc de comprendre

00:00:13.740 --> 00:00:15.360
l’apprentissage automatique en tirant parti

00:00:15.360 --> 00:00:17.220
la logique de programmation de la tradition.

00:00:17.220 --> 00:00:18.640
C’est une image de cela,

00:00:18.640 --> 00:00:20.670
qui vous montre la différence dans la façon dont

00:00:20.670 --> 00:00:24.580
la programmation de la tradition est créée
par rapport à un modèle d’apprentissage automatique.

00:00:24.580 --> 00:00:28.290
Utilisations traditionnelles de la programmation
logique esthétique du programme

00:00:28.290 --> 00:00:30.405
pour obtenir les extrants spécifiques.

00:00:30.405 --> 00:00:32.780
Les résultats statiques sont générés en fonction

00:00:32.780 --> 00:00:35.075
la logique du programme dans l’algorithme.

00:00:35.075 --> 00:00:37.130
Votre apprentissage automatique
et plus particulièrement

00:00:37.130 --> 00:00:39.290
dans un apprentissage automatique supervisé,

00:00:39.290 --> 00:00:41.810
vous avez vos données qui sont

00:00:41.810 --> 00:00:44.090
vos caractéristiques, puis vous avez

00:00:44.090 --> 00:00:47.005
dans les sorties qui sont vos étiquettes.

00:00:47.005 --> 00:00:50.720
Cela passe par le
calcul d’algorithme

00:00:50.720 --> 00:00:52.820
et le modèle est créé,

00:00:52.820 --> 00:00:55.460
nous pouvons atteindre à la base
fonction utilisateur de niveau à l’aide

00:00:55.460 --> 00:00:58.580
une fonction mathématique
créé avec les données.

00:00:58.580 --> 00:01:02.375
C’est ce qu’on appelle la formation de votre
modèle d’apprentissage automatique.

00:01:02.375 --> 00:01:06.710
Dans l’apprentissage automatique, il
sont deux catégories différentes,

00:01:06.710 --> 00:01:09.470
on s’appelle l’apprentissage supervisé

00:01:09.470 --> 00:01:12.635
et l’autre est
l’apprentissage non supervisé.

00:01:12.635 --> 00:01:14.870
Supervisé signifie que nous donnons

00:01:14.870 --> 00:01:17.165
les exemples des deux données,

00:01:17.165 --> 00:01:19.280
l’utiliser pour prédire et la réponse.

00:01:19.280 --> 00:01:22.070
Par exemple, est un chien ou est un chat.

00:01:22.070 --> 00:01:25.130
Nous donnerons le
image de balise de modèle de

00:01:25.130 --> 00:01:28.605
une catégorie de fonctionnalités pour
chiens et pour les chats.

00:01:28.605 --> 00:01:32.445
Nous lui disions
ce qu’est un chat et un chien.

00:01:32.445 --> 00:01:36.600
Ensuite, le modèle apprendrait
comment marquer les données fournies.

00:01:36.600 --> 00:01:40.760
Un apprentissage supervisé, c’est lorsque nous
lui donner un jeu de données non marqué à

00:01:40.760 --> 00:01:42.635
apprendre sans lui donner

00:01:42.635 --> 00:01:45.590
la réponse de ce que
nous voulons qu’il apprenne.

00:01:45.590 --> 00:01:49.295
Comme vous pouvez le voir, sous le
l’apprentissage automatique supervisé,

00:01:49.295 --> 00:01:52.460
il existe deux méthodes :
régression et de classification.

00:01:52.460 --> 00:01:55.235
Alors que sous le non-surveillance
l’apprentissage automatique,

00:01:55.235 --> 00:01:57.845
il y a trois
méthodes : regroupement,

00:01:57.845 --> 00:02:00.905
détection d’anomalies,
et recommandation.

00:02:00.905 --> 00:02:02.810
Maintenant que nous avons un peu de

00:02:02.810 --> 00:02:05.210
comprendre ce que
l’apprentissage automatique est,

00:02:05.210 --> 00:02:08.825
regardons le modèle
processus de construction à haut niveau.

00:02:08.825 --> 00:02:11.540
Comme vous pouvez le voir, il
sont quatre étapes principales.

00:02:11.540 --> 00:02:14.090
Nous avons dit qu’il y avait une préparation
vos données, former votre modèle,

00:02:14.090 --> 00:02:17.600
tester votre modèle, et
opérationnaliser votre modèle.

00:02:17.600 --> 00:02:18.875
A préparer vos données,

00:02:18.875 --> 00:02:21.305
et c’est une étape que vous devez trouver,

00:02:21.305 --> 00:02:22.985
sélectionner et créer une donnée,

00:02:22.985 --> 00:02:27.620
application des techniques de prétraitement
et aussi combler les lacunes dans vos données.

00:02:27.620 --> 00:02:33.455
Le modèle de train signifie que
vous devez donner votre modèle

00:02:33.455 --> 00:02:36.590
données spécifiques afin que votre
modèle va l’apprendre

00:02:36.590 --> 00:02:40.175
de ces données pour prédire
comme quelque chose à l’avenir.

00:02:40.175 --> 00:02:43.010
C’est une tâche très itérative

00:02:43.010 --> 00:02:45.990
parce que vous devrez peut-être
modifier les données du modèle

00:02:45.990 --> 00:02:48.560
jusqu’à ce que vous pensiez que vous avez

00:02:48.560 --> 00:02:52.190
une bonne donnée comptable
pour la phase de production.

00:02:52.190 --> 00:02:54.020
Modèle de test, maintenant que vous avez

00:02:54.020 --> 00:02:57.200
un modèle que vous pensez être
va très bien performer,

00:02:57.200 --> 00:02:59.800
vous pouvez le tester pour
peser les nouvelles données.

00:02:59.800 --> 00:03:01.980
Enfin, opérationnaliser votre modèle.

00:03:01.980 --> 00:03:05.030
Maintenant, c’est le moment d’opérationnaliser
votre modèle afin que vous

00:03:05.030 --> 00:03:09.360
peut le consommer à partir de
différentes applications.

