WEBVTT

00:00:03.200 --> 00:00:08.100
>> Bienvenidos de nuevo a los desarrolladores
introducción a la ciencia de datos.

00:00:08.100 --> 00:00:12.510
Una pregunta común muestra que
muchos clientes, desarrolladores,

00:00:12.510 --> 00:00:15.030
pero también los datos que los científicos me preguntan es,

00:00:15.030 --> 00:00:18.690
qué aprendizaje automático
algoritmo que debo usar?

00:00:18.690 --> 00:00:24.465
Siempre respondo, depende
en muchos factores diferentes.

00:00:24.465 --> 00:00:27.300
Pero lo más importante, el
algoritmo que seleccione depende

00:00:27.300 --> 00:00:30.750
en un aspecto de su
escenario de ciencia de datos.

00:00:30.750 --> 00:00:32.880
¿Qué quieres
hacer con sus datos?

00:00:32.880 --> 00:00:36.515
Estas son las preguntas más importantes
que deberías preguntarte a ti mismo.

00:00:36.515 --> 00:00:39.200
Específicamente, otro
cuestión importante es,

00:00:39.200 --> 00:00:41.870
¿cuál es el negocio
preguntas que desea

00:00:41.870 --> 00:00:45.305
respuesta aprendiendo
de sus datos pasados?

00:00:45.305 --> 00:00:48.679
El aprendizaje automático tiene muchos
diferentes algoritmos,

00:00:48.679 --> 00:00:51.740
y cada algoritmo diferente
puede ayudarle a lograr

00:00:51.740 --> 00:00:55.200
un objetivo y una respuesta diferentes
una pregunta diferente.

00:00:55.200 --> 00:00:57.615
Veamos algunos de estos.

00:00:57.615 --> 00:01:01.755
El primero es predecir
entre diferentes categorías.

00:01:01.755 --> 00:01:04.940
Aquí tenemos dos diferentes
tipos de métodos,

00:01:04.940 --> 00:01:07.160
y tenemos las dos clases
Clasificación

00:01:07.160 --> 00:01:08.960
lo cual es genial para responder

00:01:08.960 --> 00:01:12.315
pregunta que son
preguntas de dos opciones,

00:01:12.315 --> 00:01:15.150
como sí o no, verdadero o falso.

00:01:15.150 --> 00:01:18.545
Entonces tenemos el
clasificación multiclase,

00:01:18.545 --> 00:01:21.110
lo cual es genial para responder
preguntas complejas

00:01:21.110 --> 00:01:24.355
con múltiples opciones posibles.

00:01:24.355 --> 00:01:27.560
También puede utilizar la máquina
aprender sobre sus datos para

00:01:27.560 --> 00:01:30.405
descubrir socios en sus datos.

00:01:30.405 --> 00:01:32.450
Aquí tenemos tres tipos diferentes de

00:01:32.450 --> 00:01:34.805
método como un recomendadores,

00:01:34.805 --> 00:01:37.400
que son grandes en la predicción de lo que

00:01:37.400 --> 00:01:40.220
alguien estará interesado
en, en el futuro.

00:01:40.220 --> 00:01:46.085
La agrupación en clústeres es ideal para separar
puntos de datos similares en grupos.

00:01:46.085 --> 00:01:50.030
Por último, la detección de anomalías,
lo cual es genial en

00:01:50.030 --> 00:01:55.450
identificar y predecir
puntos de datos raros o inusuales.

00:01:55.450 --> 00:01:58.715
Otra cosa que puedes hacer
con sus datos es en realidad

00:01:58.715 --> 00:02:02.405
entender lo que
imagen se está presentando,

00:02:02.405 --> 00:02:05.045
y también entender
el lenguaje natural.

00:02:05.045 --> 00:02:08.960
Aquí tenemos métodos como
como clasificación de imágenes,

00:02:08.960 --> 00:02:13.130
que es capaz de identificar
imagen con redes neuronales.

00:02:13.130 --> 00:02:16.325
También análisis de texto, que es capaz de

00:02:16.325 --> 00:02:20.660
deriva de alta calidad
información del texto.

00:02:20.660 --> 00:02:23.150
Por último, si necesita predecir

00:02:23.150 --> 00:02:26.285
los resultados basados en el
relación entre los valores,

00:02:26.285 --> 00:02:29.930
se puede utilizar un diferente
tipo de método de regresiones.

00:02:29.930 --> 00:02:34.310
Con la regresión, eres
generalmente haciendo pronóstico por

00:02:34.310 --> 00:02:39.580
estimando la relación
entre sus valores.

00:02:39.580 --> 00:02:44.715
Para este caso de uso específico
que Sara está tratando de resolver,

00:02:44.715 --> 00:02:46.980
Creo que tenemos que predecir

00:02:46.980 --> 00:02:50.395
cuántas bicicletas serán
alquilado en la próxima hora.

00:02:50.395 --> 00:02:53.660
Realmente creo que el
predicción, lo más importante,

00:02:53.660 --> 00:02:58.460
regresión es el método correcto
que debemos usar porque

00:02:58.460 --> 00:03:00.620
realmente quieren predecir un resultado

00:03:00.620 --> 00:03:04.290
basado en la relación
entre los valores.

