WEBVTT

00:00:03.200 --> 00:00:08.100
>> Willkommen zurück bei den Entwicklern
Einführung in die Data Science.

00:00:08.100 --> 00:00:12.510
Eine häufig gestellte Frage zeigt, dass
viele Kunden, Entwickler,

00:00:12.510 --> 00:00:15.030
aber auch Datenwissenschaftler fragen mich ist,

00:00:15.030 --> 00:00:18.690
welche maschinelle Lernen
Algorithmus sollte ich verwenden?

00:00:18.690 --> 00:00:24.465
Ich antworte immer, es kommt darauf an,
auf viele verschiedene Faktoren.

00:00:24.465 --> 00:00:27.300
Vor allem aber ist die
Algorithmus, den Sie auswählen, hängt davon ab,

00:00:27.300 --> 00:00:30.750
auf einen Aspekt Ihrer
Data Science-Szenario.

00:00:30.750 --> 00:00:32.880
Was möchten Sie
mit Ihren Daten tun?

00:00:32.880 --> 00:00:36.515
Das sind die wichtigsten Fragen
dass Sie sich fragen sollten.

00:00:36.515 --> 00:00:39.200
Insbesondere eine andere
wichtige Frage ist,

00:00:39.200 --> 00:00:41.870
was ist das Geschäft
Fragen, die Sie

00:00:41.870 --> 00:00:45.305
Antwort durch Lernen
aus Ihren bisherigen Daten?

00:00:45.305 --> 00:00:48.679
Maschinelles Lernen hat viele
verschiedene Algorithmen,

00:00:48.679 --> 00:00:51.740
und jeden unterschiedlichen Algorithmus
kann Ihnen helfen,

00:00:51.740 --> 00:00:55.200
ein anderes Ziel und eine andere Antwort
eine andere Frage.

00:00:55.200 --> 00:00:57.615
Lassen Sie uns einige davon sehen.

00:00:57.615 --> 00:01:01.755
Die erste ist vorhersage
zwischen verschiedenen Kategorien.

00:01:01.755 --> 00:01:04.940
Hier haben wir zwei verschiedene
Arten von Methoden,

00:01:04.940 --> 00:01:07.160
und wir haben die Zwei-Klassen-Klasse
Klassifizierung

00:01:07.160 --> 00:01:08.960
das ist toll, wenn man antwortet

00:01:08.960 --> 00:01:12.315
Frage, die
Zwei-Wahl-Fragen,

00:01:12.315 --> 00:01:15.150
wie ja oder nein, wahr oder falsch.

00:01:15.150 --> 00:01:18.545
Dann haben wir die
mehrklassige Klassifizierung,

00:01:18.545 --> 00:01:21.110
das ist toll, wenn man antwortet
komplexe Fragen

00:01:21.110 --> 00:01:24.355
mit mehreren möglichen Optionen.

00:01:24.355 --> 00:01:27.560
Sie können auch Maschine verwenden
Lernen auf Ihre Daten zu lernen, um

00:01:27.560 --> 00:01:30.405
Partner in Ihren Daten zu entdecken.

00:01:30.405 --> 00:01:32.450
Hier haben wir drei verschiedene Arten von

00:01:32.450 --> 00:01:34.805
Methode wie eine Empfehlung,

00:01:34.805 --> 00:01:37.400
die großartig sind, um vorherzusagen, was

00:01:37.400 --> 00:01:40.220
jemand wird interessiert sein
in der Zukunft.

00:01:40.220 --> 00:01:46.085
Clustering ist großartig bei der Trennung
ähnliche Datenpunkte in Gruppen.

00:01:46.085 --> 00:01:50.030
Schließlich, Anomalie-Erkennung,
was toll ist bei

00:01:50.030 --> 00:01:55.450
Identifizieren und Prognostizieren
seltene oder ungewöhnliche Datenpunkte.

00:01:55.450 --> 00:01:58.715
Eine weitere Sache, die Sie tun können
mit Ihren Daten ist tatsächlich

00:01:58.715 --> 00:02:02.405
verstehen, was
Bild präsentiert,

00:02:02.405 --> 00:02:05.045
und auch Verständnis
die natürliche Sprache.

00:02:05.045 --> 00:02:08.960
Hier haben wir Methoden wie
als Bildklassifizierung,

00:02:08.960 --> 00:02:13.130
die in der Lage ist,
Bild mit einem neuronalen Netzwerk.

00:02:13.130 --> 00:02:16.325
Auch Textanalysen, die in der Lage sind,

00:02:16.325 --> 00:02:20.660
leitet hochwertige
Informationen aus dem Text.

00:02:20.660 --> 00:02:23.150
Schließlich, wenn Sie vorhersagen müssen,

00:02:23.150 --> 00:02:26.285
ergebnisse basierend auf der
Beziehung zwischen den Werten,

00:02:26.285 --> 00:02:29.930
Sie können eine andere
Regressionsmethode.

00:02:29.930 --> 00:02:34.310
Mit Regression sind Sie
in der Regel prognosen durch

00:02:34.310 --> 00:02:39.580
Schätzen der Beziehung
zwischen Ihren Werten.

00:02:39.580 --> 00:02:44.715
Für diesen speziellen Anwendungsfall
die Sara zu lösen versucht,

00:02:44.715 --> 00:02:46.980
Ich denke, dass wir

00:02:46.980 --> 00:02:50.395
wie viele Fahrräder werden
in der nächsten Stunde vermietet.

00:02:50.395 --> 00:02:53.660
Ich glaube wirklich, dass die
Vorhersage, am wichtigsten,

00:02:53.660 --> 00:02:58.460
Regression ist die richtige Methode
die wir verwenden sollten, weil wir

00:02:58.460 --> 00:03:00.620
wirklich ein Ergebnis vorhersagen wollen

00:03:00.620 --> 00:03:04.290
basierend auf der Beziehung
zwischen den Werten.

