WEBVTT

00:00:02.180 --> 00:00:07.505
>> Bienvenue aux développeurs
introduction à data science.

00:00:07.505 --> 00:00:10.390
Maintenant, nous allons en savoir plus
sur la façon dont vous pouvez choisir

00:00:10.390 --> 00:00:11.680
le meilleur modèle pour

00:00:11.680 --> 00:00:15.100
votre scénario de science des données avec
l’apprentissage automatique automatique.

00:00:15.100 --> 00:00:17.800
Comprendre la
puissance prédictive d’un ensemble

00:00:17.800 --> 00:00:20.420
des caractéristiques dans le respect
à une variable dépendante,

00:00:20.420 --> 00:00:21.970
est un problème très délicat,

00:00:21.970 --> 00:00:23.770
et qu’il n’y a pas de mesure universelle

00:00:23.770 --> 00:00:26.155
qui peut vous dire comment le faire.

00:00:26.155 --> 00:00:28.120
Donc, la réponse à la question,

00:00:28.120 --> 00:00:31.180
quel algorithme devrais-je
l’utilisation est toujours, cela dépend.

00:00:31.180 --> 00:00:33.400
Cela dépend de la taille, de la qualité,

00:00:33.400 --> 00:00:35.170
et la nature de vos données,

00:00:35.170 --> 00:00:39.205
cela dépend de ce que vous voulez
faire avec cette réponse spécifique.

00:00:39.205 --> 00:00:41.650
Enfin, la réponse à la question,

00:00:41.650 --> 00:00:45.119
quels paramètres je devrais utiliser
est également très difficile.

00:00:45.119 --> 00:00:47.090
Comme vous le savez, les hyperparamètres sont

00:00:47.090 --> 00:00:50.435
paramètres de niveau supérieur
qui ne peut pas être appris

00:00:50.435 --> 00:00:53.030
directement à partir des données à l’aide

00:00:53.030 --> 00:00:56.215
descente de gradient ou autre
algorithme d’optimisation.

00:00:56.215 --> 00:00:59.600
Ils décrivent les
informations sur un modèle qui

00:00:59.600 --> 00:01:03.380
doit être décidé avant
l’ajustement d’un modèle paramètres.

00:01:03.380 --> 00:01:06.125
Paramètre de paramètres du modèle
et la recherche avant

00:01:06.125 --> 00:01:08.860
valeurs de paramètres optimales basées sur

00:01:08.860 --> 00:01:13.065
l’apprentissage et l’expérience peuvent
prendre beaucoup de temps.

00:01:13.065 --> 00:01:16.085
Différents estimateurs
sont mieux adaptés

00:01:16.085 --> 00:01:19.160
pour différents types de données
et aussi différents problèmes.

00:01:19.160 --> 00:01:22.610
Si souvent, je dirais que
la partie la plus difficile de résoudre

00:01:22.610 --> 00:01:24.170
un problème d’apprentissage automatique peut être

00:01:24.170 --> 00:01:27.175
trouver le droit
estimateur pour votre travail.

00:01:27.175 --> 00:01:31.100
C’est pourquoi j’utilise très souvent
l’apprentissage automatique automatisé,

00:01:31.100 --> 00:01:34.070
qui est le processus de
automatiser le temps qui prend du temps

00:01:34.070 --> 00:01:37.295
et tâche itérative de la machine
développement de modèles d’apprentissage.

00:01:37.295 --> 00:01:41.510
Apprentissage automatique automatique
tient compte de l’incertitude,

00:01:41.510 --> 00:01:43.940
l’intégration de leur
modèle probabiliste pour

00:01:43.940 --> 00:01:47.090
déterminer le meilleur
pipeline pour essayer ensuite.

00:01:47.090 --> 00:01:51.350
Cette approche permet
l’apprentissage automatique automatisé à

00:01:51.350 --> 00:01:55.925
explorer les plus prometteurs
possibilités sans perdre de temps.

00:01:55.925 --> 00:01:58.080
Maintenant, regardons de plus près

00:01:58.080 --> 00:02:01.790
les différents automatisés
capacités d’apprentissage automatique.

00:02:01.790 --> 00:02:04.670
Tout d’abord, avec des
l’apprentissage automatique dont vous avez besoin pour

00:02:04.670 --> 00:02:08.255
identifier l’apprentissage automatique
problème que vous voulez résoudre.

00:02:08.255 --> 00:02:11.914
Il peut s’agir de classification,
prévisions ou régression.

00:02:11.914 --> 00:02:14.060
Ensuite, vous devez spécifier la source

00:02:14.060 --> 00:02:16.600
et le format de la
données de formation étiquetées.

00:02:16.600 --> 00:02:20.420
Ça va être NumPy
ou un Pandas DataFrame.

00:02:20.420 --> 00:02:22.640
Enfin, vous devez configurer

00:02:22.640 --> 00:02:25.055
la cible de l’ordinateur
pour la formation de modèles,

00:02:25.055 --> 00:02:27.064
tels que votre ordinateur local,

00:02:27.064 --> 00:02:30.380
Apprentissage automatique Azure
calcul, VM à distance,

00:02:30.380 --> 00:02:32.825
ainsi nos données Azure, par exemple,

00:02:32.825 --> 00:02:35.240
et pendant la formation, le
Azure Machine Learning

00:02:35.240 --> 00:02:37.700
servir essentiellement à un certain nombre de

00:02:37.700 --> 00:02:42.635
pipelines imparalleux qui essaient
différents algorithmes et paramètres.

00:02:42.635 --> 00:02:45.140
Il ne s’arrêtera qu’une fois qu’il frappera

00:02:45.140 --> 00:02:49.345
les critères de sortie que vous
définir dans l’expérience.

00:02:49.345 --> 00:02:54.330
La classe AutoMLConfig représente
une configuration pour soumettre

00:02:54.330 --> 00:02:56.500
un apprentissage automatique automatique

00:02:56.500 --> 00:02:59.310
expérience dans Azure Machine Learning.

00:02:59.310 --> 00:03:02.710
Cet objet de configuration
contient et procède à

00:03:02.710 --> 00:03:06.245
les paramètres de configuration
l’expérience autour,

00:03:06.245 --> 00:03:10.145
ainsi que les données de formation qui
doit être utilisé à l’exécution.

00:03:10.145 --> 00:03:14.070
Pour en savoir plus, veuillez consulter
aka.ms/AutoMLConfig-Class.

