WEBVTT

00:00:02.180 --> 00:00:07.505
>> Bienvenidos de nuevo a los desarrolladores
introducción a la Ciencia de Datos.

00:00:07.505 --> 00:00:10.390
Ahora, vamos a aprender más
acerca de cómo se puede elegir

00:00:10.390 --> 00:00:11.680
el mejor modelo para

00:00:11.680 --> 00:00:15.100
su escenario de ciencia de datos con
el aprendizaje automático automatizado.

00:00:15.100 --> 00:00:17.800
Entender el
poder predictivo de un conjunto

00:00:17.800 --> 00:00:20.420
de características con respeto
a una variable dependiente,

00:00:20.420 --> 00:00:21.970
es un problema muy complicado,

00:00:21.970 --> 00:00:23.770
y que no hay una métrica universal

00:00:23.770 --> 00:00:26.155
que puede decirle cómo hacer eso.

00:00:26.155 --> 00:00:28.120
Así que la respuesta a la pregunta,

00:00:28.120 --> 00:00:31.180
qué algoritmo debería
uso es siempre, depende.

00:00:31.180 --> 00:00:33.400
Depende del tamaño, la calidad,

00:00:33.400 --> 00:00:35.170
y la naturaleza de sus datos,

00:00:35.170 --> 00:00:39.205
depende de lo que quieras
hacer con esa respuesta específica.

00:00:39.205 --> 00:00:41.650
Por último, la respuesta a la pregunta,

00:00:41.650 --> 00:00:45.119
qué parámetros debo usar
también es muy difícil.

00:00:45.119 --> 00:00:47.090
Como saben, los hiperparámetros son

00:00:47.090 --> 00:00:50.435
parámetros de nivel superior
que no se puede aprender

00:00:50.435 --> 00:00:53.030
directamente a partir de los datos utilizando

00:00:53.030 --> 00:00:56.215
descenso de gradiente u otro
algoritmo de optimización.

00:00:56.215 --> 00:00:59.600
Describen la estructura
información sobre un modelo que

00:00:59.600 --> 00:01:03.380
debe decidirse antes de
ajuste de los parámetros de un modelo.

00:01:03.380 --> 00:01:06.125
Configuración de parámetros del modelo
y la búsqueda antes de

00:01:06.125 --> 00:01:08.860
valores óptimos de parámetros basados en

00:01:08.860 --> 00:01:13.065
aprendizaje y experiencia pueden
también consume mucho tiempo.

00:01:13.065 --> 00:01:16.085
Diferentes estimadores
son más adecuados

00:01:16.085 --> 00:01:19.160
para diferentes tipos de datos
y también diferentes problemas.

00:01:19.160 --> 00:01:22.610
Tan a menudo diría que
la parte más difícil de resolver

00:01:22.610 --> 00:01:24.170
un problema de aprendizaje automático puede ser

00:01:24.170 --> 00:01:27.175
encontrar el derecho
estimador para su trabajo.

00:01:27.175 --> 00:01:31.100
Es por eso que muy a menudo uso
aprendizaje automático automático,

00:01:31.100 --> 00:01:34.070
que es el proceso de
automatizar el tiempo que consume

00:01:34.070 --> 00:01:37.295
y la tarea iterativa de la máquina
desarrollo del modelo de aprendizaje.

00:01:37.295 --> 00:01:41.510
Aprendizaje automático automático de la máquina
tiene en cuenta la incertidumbre,

00:01:41.510 --> 00:01:43.940
incorporando sus
modelo probabilístico para

00:01:43.940 --> 00:01:47.090
determinar el mejor
tubería para probar a continuación.

00:01:47.090 --> 00:01:51.350
Este enfoque permite
aprendizaje automático a

00:01:51.350 --> 00:01:55.925
explorar los más prometedores
posibilidades sin perder el tiempo.

00:01:55.925 --> 00:01:58.080
Ahora, echemos un vistazo más de cerca a

00:01:58.080 --> 00:02:01.790
los diferentes automatizados
capacidades de aprendizaje automático.

00:02:01.790 --> 00:02:04.670
En primer lugar, con
aprendizaje automático que necesita para

00:02:04.670 --> 00:02:08.255
identificar el aprendizaje automático
problema que desea resolver.

00:02:08.255 --> 00:02:11.914
Estos pueden ser clasificación,
pronosticar o regresión.

00:02:11.914 --> 00:02:14.060
A continuación, debe especificar la fuente

00:02:14.060 --> 00:02:16.600
y el formato de la
datos de entrenamiento etiquetados.

00:02:16.600 --> 00:02:20.420
Esto va a ser NumPy
matrices o un DataFrame de Pandas.

00:02:20.420 --> 00:02:22.640
Por último, debe configurar

00:02:22.640 --> 00:02:25.055
el objetivo de la computadora
para el entrenamiento de modelos,

00:02:25.055 --> 00:02:27.064
como su computadora local,

00:02:27.064 --> 00:02:30.380
Aprendizaje automático de Azure
computación, VM remota,

00:02:30.380 --> 00:02:32.825
por lo que nuestros Azure Databricks, por ejemplo,

00:02:32.825 --> 00:02:35.240
y durante el entrenamiento el
Azure Machine Learning

00:02:35.240 --> 00:02:37.700
servir básicamente a una serie de

00:02:37.700 --> 00:02:42.635
tuberías de imparallel que intentan
diferentes algoritmos y parámetros.

00:02:42.635 --> 00:02:45.140
Se detendrá sólo una vez que golpee

00:02:45.140 --> 00:02:49.345
los criterios de salida que usted
definir en el experimento.

00:02:49.345 --> 00:02:54.330
La clase AutoMLConfig representa
una configuración para enviar

00:02:54.330 --> 00:02:56.500
un aprendizaje automático automatizado

00:02:56.500 --> 00:02:59.310
experimento en Azure Machine Learning.

00:02:59.310 --> 00:03:02.710
Este objeto de configuración
contiene y procede a

00:03:02.710 --> 00:03:06.245
los parámetros para configurar
el experimento alrededor,

00:03:06.245 --> 00:03:10.145
así como los datos de formación que
debe utilizarse en tiempo de ejecución.

00:03:10.145 --> 00:03:14.070
Para obtener más información, consulte
aka.ms/AutoMLConfig-Class.

