WEBVTT

00:00:02.180 --> 00:00:07.505
>> Willkommen zurück bei den Entwicklern
Einführung in Data Science.

00:00:07.505 --> 00:00:10.390
Jetzt wollen wir mehr erfahren
darüber, wie Sie auswählen können

00:00:10.390 --> 00:00:11.680
das beste Modell für

00:00:11.680 --> 00:00:15.100
Ihr Data Science-Szenario mit
automatisiertes maschinelles Lernen.

00:00:15.100 --> 00:00:17.800
Verständnis der
Vorhersagekraft eines Satzes

00:00:17.800 --> 00:00:20.420
von Merkmalen mit Respekt
zu einer abhängigen Variablen,

00:00:20.420 --> 00:00:21.970
ist ein sehr schwieriges Problem,

00:00:21.970 --> 00:00:23.770
und dass es keine universelle Messgröße gibt,

00:00:23.770 --> 00:00:26.155
die Ihnen sagen können, wie Sie das tun können.

00:00:26.155 --> 00:00:28.120
Die Antwort auf die Frage

00:00:28.120 --> 00:00:31.180
welcher Algorithmus soll ich
Verwendung ist immer, es kommt darauf an.

00:00:31.180 --> 00:00:33.400
Es hängt von der Größe, der Qualität,

00:00:33.400 --> 00:00:35.170
und die Art Ihrer Daten,

00:00:35.170 --> 00:00:39.205
es hängt davon ab, was Sie wollen
mit dieser spezifischen Antwort zu tun.

00:00:39.205 --> 00:00:41.650
Schließlich lautet die Antwort auf die Frage:

00:00:41.650 --> 00:00:45.119
welche Parameter ich verwenden sollte
ist auch sehr anspruchsvoll.

00:00:45.119 --> 00:00:47.090
Wie Sie wissen, sind Hyperparameter

00:00:47.090 --> 00:00:50.435
höhere Level-Parameter
die nicht erlernt werden können

00:00:50.435 --> 00:00:53.030
direkt aus den Daten mit Hilfe

00:00:53.030 --> 00:00:56.215
Gradientenabstieg oder andere
Optimierungsalgorithmus.

00:00:56.215 --> 00:00:59.600
Sie beschreiben die strukturellen
Informationen zu einem Modell, das

00:00:59.600 --> 00:01:03.380
muss entschieden werden, bevor
Passend zu einem Modellparameter.

00:01:03.380 --> 00:01:06.125
Einstellung der Modellparameter
und suchen vor

00:01:06.125 --> 00:01:08.860
optimale Parameterwerte basierend auf

00:01:08.860 --> 00:01:13.065
Lernen und Erleben kann
auch sehr zeitaufwändig sein.

00:01:13.065 --> 00:01:16.085
Verschiedene Schätzer
sind besser geeignet

00:01:16.085 --> 00:01:19.160
für verschiedene Datentypen
und auch verschiedene Probleme.

00:01:19.160 --> 00:01:22.610
So oft würde ich sagen, dass
der schwierigste Teil des Lösens

00:01:22.610 --> 00:01:24.170
ein Problem des maschinellen Lernens kann

00:01:24.170 --> 00:01:27.175
das Richtige finden
Schätzer für Ihren Job.

00:01:27.175 --> 00:01:31.100
Deshalb benutze ich sehr oft
automatisiertes maschinelles Lernen,

00:01:31.100 --> 00:01:34.070
was der Prozess der
Automatisierung der zeitaufwändigen

00:01:34.070 --> 00:01:37.295
und iterative Aufgabe der Maschine
Lernmodellentwicklung.

00:01:37.295 --> 00:01:41.510
Automatisiertes maschinelles Lernen
berücksichtigt Unsicherheit,

00:01:41.510 --> 00:01:43.940
Einbeziehung ihrer
probabilistisches Modell

00:01:43.940 --> 00:01:47.090
Die Bestimmung der besten
Pipeline, um es als nächstes zu versuchen.

00:01:47.090 --> 00:01:51.350
Dieser Ansatz ermöglicht
automatisiertes maschinelles Lernen

00:01:51.350 --> 00:01:55.925
erkunden Sie die vielversprechendsten
Möglichkeiten ohne Zeitverschwendung.

00:01:55.925 --> 00:01:58.080
Werfen wir nun einen genaueren Blick auf

00:01:58.080 --> 00:02:01.790
die verschiedenen automatisierten
Machine Learning-Fähigkeiten.

00:02:01.790 --> 00:02:04.670
Zuallererst mit automatisierten
maschinelles Lernen, das Sie benötigen, um

00:02:04.670 --> 00:02:08.255
identifizieren sie das maschinelle Lernen
Problem, das Sie lösen möchten.

00:02:08.255 --> 00:02:11.914
Dies kann Klassifizierung sein,
Prognose oder Regression.

00:02:11.914 --> 00:02:14.060
Dann müssen Sie die Quelle angeben

00:02:14.060 --> 00:02:16.600
und das Format der
beschriftete Trainingsdaten.

00:02:16.600 --> 00:02:20.420
Dies wird NumPy sein
Arrays oder einem Pandas DataFrame.

00:02:20.420 --> 00:02:22.640
Schließlich müssen Sie

00:02:22.640 --> 00:02:25.055
das Computerziel
für Modelltraining,

00:02:25.055 --> 00:02:27.064
wie z. B. Ihr lokaler Computer,

00:02:27.064 --> 00:02:30.380
Azure Machine Learning
Rechen-, Remote-VM,

00:02:30.380 --> 00:02:32.825
unsere Azure Databricks, z. B.

00:02:32.825 --> 00:02:35.240
und während der Ausbildung der
Azure Machine Learning

00:02:35.240 --> 00:02:37.700
dienen im Wesentlichen einer Reihe von

00:02:37.700 --> 00:02:42.635
imparallele Pipelines, die versuchen,
verschiedenen Algorithmen und Parametern.

00:02:42.635 --> 00:02:45.140
Es wird nur stoppen, wenn es trifft

00:02:45.140 --> 00:02:49.345
die Ausstiegskriterien, die Sie
im Experiment definieren.

00:02:49.345 --> 00:02:54.330
Die AutoMLConfig-Klasse stellt
eine Konfiguration zum Übermitteln

00:02:54.330 --> 00:02:56.500
ein automatisiertes maschinelles Lernen

00:02:56.500 --> 00:02:59.310
Experiment in Azure Machine Learning.

00:02:59.310 --> 00:03:02.710
Dieses Konfigurationsobjekt
enthält und fährt fort,

00:03:02.710 --> 00:03:06.245
die Parameter für die Konfiguration
das Experiment um,

00:03:06.245 --> 00:03:10.145
sowie die Schulungsdaten, die
muss zur Laufzeit verwendet werden.

00:03:10.145 --> 00:03:14.070
Weitere Informationen finden Sie unter
aka.ms/AutoMLConfig-Class.

