WEBVTT

00:00:03.200 --> 00:00:08.100
>> 開発者へようこそ
データ サイエンスの概要

00:00:08.100 --> 00:00:12.510
一般的な質問は、次のことが示されています。
多くの顧客、開発者、

00:00:12.510 --> 00:00:15.030
しかし、データサイエンティストは私に尋ねる、

00:00:15.030 --> 00:00:18.690
どの機械学習
アルゴリズムは私が使用する必要がありますか?

00:00:18.690 --> 00:00:24.465
私はいつも答える、それは依存する
多くの異なる要因に。

00:00:24.465 --> 00:00:27.300
しかし、最も重要なことは、
選択するアルゴリズムは、依存します

00:00:27.300 --> 00:00:30.750
あなたの一つの側面で
データ サイエンスシナリオ。

00:00:30.750 --> 00:00:32.880
何をしたいですか
あなたのデータを使用しますか?

00:00:32.880 --> 00:00:36.515
これは最も重要な質問です
あなたは自分自身に尋ねるべきだと思います。

00:00:36.515 --> 00:00:39.200
具体的には、別の
重要な問題は、

00:00:39.200 --> 00:00:41.870
ビジネスとは何か
あなたがしたい質問

00:00:41.870 --> 00:00:45.305
学習による答え
過去のデータから?

00:00:45.305 --> 00:00:48.679
機械学習には多くの
異なるアルゴリズム、

00:00:48.679 --> 00:00:51.740
そしてそれぞれの異なるアルゴリズム
あなたが達成するのを助けることができます

00:00:51.740 --> 00:00:55.200
別の目標と答え
別の質問。

00:00:55.200 --> 00:00:57.615
これらのいくつかを見てみましょう。

00:00:57.615 --> 00:01:01.755
最初のものは予測です
異なるカテゴリ間で。

00:01:01.755 --> 00:01:04.940
ここでは、2つの異なるがあります
メソッドの種類、

00:01:04.940 --> 00:01:07.160
そして、私たちは2クラスを持っています
分類

00:01:07.160 --> 00:01:08.960
これは答えるのが得意です

00:01:08.960 --> 00:01:12.315
問題は
2つの選択肢の質問、

00:01:12.315 --> 00:01:15.150
イエスかノーか、真実か偽りかのように。

00:01:15.150 --> 00:01:18.545
その後、私たちは
多クラス分類,

00:01:18.545 --> 00:01:21.110
これは答えるのが得意です
複雑な質問

00:01:21.110 --> 00:01:24.355
複数のオプションを使用できます。

00:01:24.355 --> 00:01:27.560
マシンも使用できます
データの学習

00:01:27.560 --> 00:01:30.405
データ内のパートナーを発見する。

00:01:30.405 --> 00:01:32.450
ここでは、3つの異なるタイプがあります

00:01:32.450 --> 00:01:34.805
推薦者などの方法、

00:01:34.805 --> 00:01:37.400
何を予測するのには素晴らしいです

00:01:37.400 --> 00:01:40.220
誰かが興味を持つでしょう
将来的には、

00:01:40.220 --> 00:01:46.085
クラスタリングは分離に最適です
類似したデータポイントをグループに変換します。

00:01:46.085 --> 00:01:50.030
最後に、異常検出、
で素晴らしいです

00:01:50.030 --> 00:01:55.450
識別と予測
まれなデータ ポイントまたは異常なデータ ポイント。

00:01:55.450 --> 00:01:58.715
あなたができること
あなたのデータは実際に

00:01:58.715 --> 00:02:02.405
何を理解する
画像が提示されています,

00:02:02.405 --> 00:02:05.045
また理解する
自然言語。

00:02:05.045 --> 00:02:08.960
ここでは、このような方法があります
画像分類として、

00:02:08.960 --> 00:02:13.130
識別できる
ニューラルネットワークを持つ画像。

00:02:13.130 --> 00:02:16.325
また、テキスト分析、それが可能です

00:02:16.325 --> 00:02:20.660
高品質を導き出す
テキストからの情報。

00:02:20.660 --> 00:02:23.150
最後に、予測する必要がある場合

00:02:23.150 --> 00:02:26.285
に基づく結果
値間の関係

00:02:26.285 --> 00:02:29.930
別の方法を使用できます
回帰法の種類。

00:02:29.930 --> 00:02:34.310
回帰では、あなたは
一般的に予測を行う

00:02:34.310 --> 00:02:39.580
関係を推定する
あなたの値の間に。

00:02:39.580 --> 00:02:44.715
この特定のユースケース
サラが解決しようとしていると、

00:02:44.715 --> 00:02:46.980
私たちは予測する必要があると思います

00:02:46.980 --> 00:02:50.395
自転車の台数
次の時間に借りた。

00:02:50.395 --> 00:02:53.660
私は本当にと思います
予測、最も重要なことは、

00:02:53.660 --> 00:02:58.460
回帰は正しい方法です
私たちが使うべきことは、私たちが使うべきだからです

00:02:58.460 --> 00:03:00.620
本当に結果を予測したい

00:03:00.620 --> 00:03:04.290
関係に基づく
値の間に。

