WEBVTT

00:00:02.000 --> 00:00:05.040
>> Hallo alle, und willkommen zurück zu

00:00:05.040 --> 00:00:07.890
Entwickler Einführung
datenwissenschaft.

00:00:07.890 --> 00:00:10.560
Data Science Machine Learning und KI,

00:00:10.560 --> 00:00:14.250
sind alle kritisch, aber wie kann
Sie beginnen mit ihnen?

00:00:14.250 --> 00:00:16.110
In diesem Video lernen wir

00:00:16.110 --> 00:00:18.660
was der Data Science-Lebenszyklus ist.

00:00:18.660 --> 00:00:22.560
Der Lebenszyklus ist für
Data-Science-Projekte, die

00:00:22.560 --> 00:00:27.480
beabsichtigt, als Teil der
Ihre intelligenten Anwendungen.

00:00:27.480 --> 00:00:30.150
Der Data Science-Lebenszyklus ist

00:00:30.150 --> 00:00:32.850
bestehend aus fünf hauptwichtigsten
Stufen, die sind;

00:00:32.850 --> 00:00:36.540
Geschäftsverständnis, Daten
Erwerb und Verständnis,

00:00:36.540 --> 00:00:40.110
Modellierung, Bereitstellung,
und Kundenakzeptanz.

00:00:40.110 --> 00:00:43.245
Beginnen wir mit
Geschäftsverständnis.

00:00:43.245 --> 00:00:46.035
Hier gibt es zwei Hauptziele.

00:00:46.035 --> 00:00:49.310
Die erste betrifft die
Festlegung der Ziele.

00:00:49.310 --> 00:00:50.570
Sie müssen mit

00:00:50.570 --> 00:00:53.540
Ihre Kunden und andere
Interessenvertreter zu verstehen,

00:00:53.540 --> 00:00:55.625
die Geschäftsprobleme zu identifizieren.

00:00:55.625 --> 00:00:59.610
Das zweite Ziel ist
Identifizierung von Datenquellen.

00:00:59.610 --> 00:01:02.600
Sie müssen die relevanten
Daten, die Ihnen helfen,

00:01:02.600 --> 00:01:04.310
die Frage, die definieren,

00:01:04.310 --> 00:01:07.310
das Ziel Ihrer
Data Science-Projekt.

00:01:07.310 --> 00:01:11.030
Danach haben wir Daten
Erwerb und Verständnis.

00:01:11.030 --> 00:01:15.800
Die Ziele hier sind,
ein sauberes, hochwertiges Dataset,

00:01:15.800 --> 00:01:18.425
und eine
Lösungsarchitektur von

00:01:18.425 --> 00:01:22.375
die Datenpipeline, die
aktualisiert und bewertet Ihre Daten.

00:01:22.375 --> 00:01:24.090
Es gibt drei Hauptschritte,

00:01:24.090 --> 00:01:26.280
Wie Sie sehen können. Nehmen Sie die Daten auf.

00:01:26.280 --> 00:01:28.310
Hier müssen Sie
Ihre Daten in

00:01:28.310 --> 00:01:31.535
die Zielanalyseumgebung
die du verwenden wirst,

00:01:31.535 --> 00:01:34.460
dann müssen Sie erkunden
Daten, um zu bestimmen, ob

00:01:34.460 --> 00:01:37.340
die Datenqualität ist gut
genug, um die Frage zu beantworten,

00:01:37.340 --> 00:01:39.230
und schließlich müssen Sie

00:01:39.230 --> 00:01:43.055
eine Datenpipeline zum Bewerten
neue und aktualisieren Sie Daten.

00:01:43.055 --> 00:01:46.275
Danach gibt es
die Modellierungsphase.

00:01:46.275 --> 00:01:50.250
Hier sind die Hauptziele
Feature-Engineering,

00:01:50.250 --> 00:01:52.550
Sie müssen die
Datenfunktionen von

00:01:52.550 --> 00:01:55.250
rohen Daten, um
Modelltraining.

00:01:55.250 --> 00:01:58.190
Modelltraining, das Sie brauchen
um das Modell zu finden, das

00:01:58.190 --> 00:02:01.390
die Frage in
sehr genau,

00:02:01.390 --> 00:02:03.395
und auch Sie müssen vergleichen

00:02:03.395 --> 00:02:05.780
unterschiedlichen Erfolgsmetriken, um

00:02:05.780 --> 00:02:08.420
verstehen, was das Beste ist
Modell für Ihre Lösung,

00:02:08.420 --> 00:02:10.520
und schließlich müssen Sie feststellen, ob

00:02:10.520 --> 00:02:13.190
Ihr Modell ist geeignet
für die Produktion,

00:02:13.190 --> 00:02:15.950
bereit für die Bereitstellung.

00:02:15.950 --> 00:02:19.470
Schließlich gibt es die Bereitstellung.

00:02:19.470 --> 00:02:22.880
Hier müssen wir die
Modell und die Pipeline, um

00:02:22.880 --> 00:02:26.360
ein Produktionsumfeld von
Anwendungsverbrauch.

00:02:26.360 --> 00:02:27.860
Um Ihre Modelle bereitzustellen,

00:02:27.860 --> 00:02:31.775
Sie müssen sie aussetzen
mit einer offenen API-Schnittstelle.

00:02:31.775 --> 00:02:34.505
Die Schnittstelle ermöglicht es, das Modell

00:02:34.505 --> 00:02:37.670
leicht von verschiedenen
Arten von Anwendungen.

00:02:37.670 --> 00:02:41.250
Ein Beispiel für diese
Anwendung sind Online-Website,

00:02:41.250 --> 00:02:45.425
Tabellenkalkulation, Dashboard,
Back-End-Anwendungen.

00:02:45.425 --> 00:02:50.405
Danach müssen Sie
Ihre Projektergebnisse.

00:02:50.405 --> 00:02:53.480
Sie müssen bestätigen, dass
die Pipeline, das Modell,

00:02:53.480 --> 00:02:56.925
und deren Einsatz in einem
Produktionsumgebung zu befriedigen,

00:02:56.925 --> 00:03:01.345
selbstverständlich auch Ihre Kunden
oder Stakeholder-Ziele.

00:03:01.345 --> 00:03:03.800
Sie erfahren mehr über

00:03:03.800 --> 00:03:08.610
den Data Science-Lebenszyklus
aka.ms/datasciencelifecycle.

