WEBVTT

00:00:00.000 --> 00:00:02.610
>> Es ist endlich an der Zeit,
mit unseren Daten herumspielen.

00:00:02.610 --> 00:00:04.830
Ich habe eine lokale CSV-Datei mit allen

00:00:04.830 --> 00:00:08.235
meine Daten und ich muss sicherstellen, dass
dass das in die Cloud gelangt.

00:00:08.235 --> 00:00:10.740
Zusätzlich benötige ich
, um meine Daten vorzubereiten.

00:00:10.740 --> 00:00:12.750
Ich weiß, dass ich

00:00:12.750 --> 00:00:15.865
prognostizieren, wie viele Fahrräder
an einem bestimmten Tag vermietet werden.

00:00:15.865 --> 00:00:19.770
Das bedeutet, dass ich meine
Daten für eine Zeitreihenplanung.

00:00:19.770 --> 00:00:22.790
Wie immer gibt es
zusätzliche Dokumentation auf

00:00:22.790 --> 00:00:26.350
bildschirm und dann eine Beschreibung
unten. Fangen wir an.

00:00:26.350 --> 00:00:30.750
Zuerst muss ich sicherstellen, dass
auf mein Dataset kann zugegriffen werden.

00:00:31.600 --> 00:00:33.980
Ich werde es hinzufügen
in denselben Ordner

00:00:33.980 --> 00:00:36.420
dass mein Jupyter-Notebook in ist.

00:00:36.880 --> 00:00:40.174
Ich werde dieses Dataset hochladen

00:00:40.174 --> 00:00:42.955
zu meinem Machine Learning
Datenspeicher in Azure.

00:00:42.955 --> 00:00:45.355
Ich greife meine CSV-Datei,

00:00:45.355 --> 00:00:47.825
in den Dataset-Ordner hochladen,

00:00:47.825 --> 00:00:50.900
Überschreiben von Daten
das bereits existiert,

00:00:50.900 --> 00:00:53.000
und ich möchte den Fortschritt der

00:00:53.000 --> 00:00:56.045
diesen Prozess innerhalb der
Visual Studio-Code.

00:00:56.045 --> 00:00:58.640
Toll, das sieht so aus, als ob es funktioniert hat.

00:00:58.640 --> 00:01:03.010
Als Nächstes muss ich
ein Dataset-Objekt,

00:01:03.010 --> 00:01:06.910
das ist eine Klasse von
azureml-core und ich muss

00:01:06.910 --> 00:01:08.935
mein Datum in einem
weg, wie ich es machen werde

00:01:08.935 --> 00:01:11.755
einfacher für mich, meine Daten zu sortieren.

00:01:11.755 --> 00:01:15.050
Ich muss einige Klassen importieren.

00:01:15.250 --> 00:01:18.220
Jetzt muss ich herausfinden,
welche Spalte ich gehe

00:01:18.220 --> 00:01:21.295
zu verwenden, um vorherzusagen, welche andere Spalte.

00:01:21.295 --> 00:01:22.855
Bevor ich dies entscheide,

00:01:22.855 --> 00:01:25.210
Ich öffne die CSV-Datei

00:01:25.210 --> 00:01:27.970
und werfen Sie einen Blick auf
die Daten, die ich habe.

00:01:27.970 --> 00:01:30.685
Ich bemerkte, dass hier habe ich Datum,

00:01:30.685 --> 00:01:34.540
Saison, Jahr, Monat,
an welchem Wochentag,

00:01:34.540 --> 00:01:37.870
was das Wetter ist, die
Temperatur, die Luftfeuchtigkeit,

00:01:37.870 --> 00:01:41.160
die Windgeschwindigkeit und
Ich habe auch zählen,

00:01:41.160 --> 00:01:43.805
die Anzahl der Fahrräder
die vermietet wurden.

00:01:43.805 --> 00:01:49.650
Ich denke, was ich tun werde, ist, dass ich
Datum verwenden, um die Anzahl vorherzusagen.

00:01:50.000 --> 00:01:52.710
Lassen Sie uns das hier definieren.

00:01:52.710 --> 00:01:55.010
Jetzt habe ich meinen Zeitspaltennamen,

00:01:55.010 --> 00:01:58.520
die verwendet werden, um vorherzusagen,
mein Zielspaltenname.

00:01:58.520 --> 00:02:00.890
Als nächstes werde ich

00:02:00.890 --> 00:02:03.650
eine lokale Variable namens
Dataset, das

00:02:03.650 --> 00:02:05.570
verfolgen Sie meine Daten und ich werde

00:02:05.570 --> 00:02:08.360
Konvertieren dieses Datasets
in einen Pandas DataFrame.

00:02:08.360 --> 00:02:11.060
Beachten Sie, dass ich nehme 5,

00:02:11.060 --> 00:02:14.630
die die erste Ausdrucksform ausdrucken wird
fünf Zeilen dieses Datenrahmens.

00:02:14.630 --> 00:02:17.150
Wir können überprüfen, ob
Diese Zeilen sind korrekt.

00:02:17.150 --> 00:02:19.920
Es ist der 1. Januar 2011,

00:02:19.920 --> 00:02:23.605
die Temperatur betrug 0.344167

00:02:23.605 --> 00:02:24.920
und wir können einen Blick auf

00:02:24.920 --> 00:02:28.200
unsere CSV-Datei und sehen Sie, dass
es war noch der 1. Januar,

00:02:28.200 --> 00:02:36.440
2011, und dass das Wetter war
oder die Temperatur war 0.33344167.

00:02:36.440 --> 00:02:39.620
Das sieht richtig aus. Jetzt haben wir
einen Zusammenhang zwischen unseren Daten

00:02:39.620 --> 00:02:43.890
in Azure und unseren lokalen
Visual Studio Code-Umgebung.

