WEBVTT

00:00:03.200 --> 00:00:08.100
>> Witamy z powrotem dla programistów
wprowadzenie do nauki o danych.

00:00:08.100 --> 00:00:12.510
Wspólne pytanie pokazuje, że
wielu klientów, programistów,

00:00:12.510 --> 00:00:15.030
ale także analitycy danych pytają mnie jest,

00:00:15.030 --> 00:00:18.690
które uczenie maszynowe
algorytm powinienem użyć?

00:00:18.690 --> 00:00:24.465
Zawsze odpowiadam, to zależy od
na wielu różnych czynnikach.

00:00:24.465 --> 00:00:27.300
Ale co najważniejsze,
wybranego algorytmu zależy od

00:00:27.300 --> 00:00:30.750
na jednym aspekcie
scenariusz nauki o danych.

00:00:30.750 --> 00:00:32.880
Co chcesz zrobić
z twoimi danymi?

00:00:32.880 --> 00:00:36.515
To są najważniejsze pytania
należy zadać sobie pytanie.

00:00:36.515 --> 00:00:39.200
W szczególności inny
ważne jest,

00:00:39.200 --> 00:00:41.870
czym jest biznes
pytania, które chcesz

00:00:41.870 --> 00:00:45.305
odpowiedź poprzez uczenie się
z poprzednich danych?

00:00:45.305 --> 00:00:48.679
Uczenie maszynowe ma wiele
różne algorytmy,

00:00:48.679 --> 00:00:51.740
i każdy inny algorytm
może pomóc w osiągnięciu

00:00:51.740 --> 00:00:55.200
inny cel i odpowiedź
inne pytanie.

00:00:55.200 --> 00:00:57.615
Zobaczmy niektóre z nich.

00:00:57.615 --> 00:01:01.755
Pierwszym z nich jest przewidywanie
pomiędzy różnymi kategoriami.

00:01:01.755 --> 00:01:04.940
Tutaj mamy dwa różne
rodzaje metod,

00:01:04.940 --> 00:01:07.160
i mamy dwie klasy
Klasyfikacji

00:01:07.160 --> 00:01:08.960
który jest wielki w odpowiadaniu

00:01:08.960 --> 00:01:12.315
pytanie, które są
pytania o dwa wybory,

00:01:12.315 --> 00:01:15.150
jak tak lub nie, prawda lub fałsz.

00:01:15.150 --> 00:01:18.545
Następnie mamy
klasyfikacja wieloklasowa,

00:01:18.545 --> 00:01:21.110
który jest wielki w odpowiadaniu
złożone pytania

00:01:21.110 --> 00:01:24.355
z wieloma możliwymi opcjami.

00:01:24.355 --> 00:01:27.560
Można również użyć maszyny
uczenia się na danych, aby

00:01:27.560 --> 00:01:30.405
odnajduj partnerów w Twoich danych.

00:01:30.405 --> 00:01:32.450
Tutaj mamy trzy różne rodzaje

00:01:32.450 --> 00:01:34.805
metody, takiej jak rekomendatorzy,

00:01:34.805 --> 00:01:37.400
które są świetne w przewidywaniu, co

00:01:37.400 --> 00:01:40.220
ktoś będzie zainteresowany
w przyszłości.

00:01:40.220 --> 00:01:46.085
Klastrowanie doskonale nadaje się do oddzielania
podobnych punktów danych w grupy.

00:01:46.085 --> 00:01:50.030
Wreszcie, wykrywanie anomalii,
który jest wielki w

00:01:50.030 --> 00:01:55.450
identyfikowanie i przewidywanie
rzadkich lub nietypowych punktów danych.

00:01:55.450 --> 00:01:58.715
Inna sprawa, że można zrobić
z twoimi danymi jest w rzeczywistości

00:01:58.715 --> 00:02:02.405
zrozumienie, co
obraz prezentuje,

00:02:02.405 --> 00:02:05.045
a także zrozumienie
języka naturalnego.

00:02:05.045 --> 00:02:08.960
Tutaj mamy takie metody
jako klasyfikacja obrazu,

00:02:08.960 --> 00:02:13.130
który jest w stanie zidentyfikować
z sieciami neuronowymi.

00:02:13.130 --> 00:02:16.325
Również analiza tekstu, która jest w stanie

00:02:16.325 --> 00:02:20.660
czerpie wysokiej jakości
informacji z tekstu.

00:02:20.660 --> 00:02:23.150
Wreszcie, jeśli trzeba przewidzieć

00:02:23.150 --> 00:02:26.285
wyniki oparte na
związek między wartościami,

00:02:26.285 --> 00:02:29.930
można użyć innego
typu metody regresji.

00:02:29.930 --> 00:02:34.310
Z regresją, jesteś
ogólnie prognozując

00:02:34.310 --> 00:02:39.580
szacowanie relacji
pomiędzy wartościami.

00:02:39.580 --> 00:02:44.715
W tym konkretnym przypadku użycia
że Sara próbuje rozwiązać,

00:02:44.715 --> 00:02:46.980
Myślę, że musimy przewidzieć

00:02:46.980 --> 00:02:50.395
ile rowerów będzie
wynajęty w ciągu najbliższej godziny.

00:02:50.395 --> 00:02:53.660
Naprawdę uważam, że
przewidywanie, co najważniejsze,

00:02:53.660 --> 00:02:58.460
regresja jest właściwą metodą
że powinniśmy używać, ponieważ

00:02:58.460 --> 00:03:00.620
naprawdę chcesz przewidzieć wynik

00:03:00.620 --> 00:03:04.290
w oparciu o relacje
pomiędzy wartościami.

