[Azure Machine Learning] Escenarios supervisados vs. no supervisados en Azure ML

Una vez que contamos con las fuentes de datos necesarias y los datos se encuentran limpios, ya es momento de empezar a planificar la construcción del modelo predictivo que mejor represente nuestros datos.

Fuente: Microsoft

Existen muchos algoritmos para la construcción de modelos predictivos en el ecosistema del aprendizaje automático y antes de elegir uno hay que tener bien en claro que tipo de problema de aprendizaje automático necesitamos resolver.

Aprendizaje supervisado

En el aprendizaje supervisado, cada dato de interés se encuentra etiquetado y dependiendo al tipo de variable que deseemos predecir, nos encontraremos con problemas de regresión (cuando el dato de interés tiene un valor continuo) o clasificación (cuando el dato de interés tiene un valor discreto). El objetivo del aprendizaje supervisado es estudiar muchos ejemplos etiquetados y, luego, poder realizar predicciones sobre datos de interés futuros.

Clasificación

Identificar si un cáncer es benigno o maligno en base a una fotografía es un ejemplo de clasificación binaria, y un sistema de reconocimiento de letras es un ejemplo de clasificación multiclase. Vale mencionar que también podemos usar algoritmos de clasificación multiclase como si fueran de clasificación binaria.

Los algoritmos de detección de anomalías son un caso especial de clasificación. Debido a que los casos anómalos suelen representar menos de un 1% de la muestra total, no podemos entrenar un clasificador binario para identificar qué es una anomalía. Entonces, un detector de anomalías se entrena para identificar características comunes de los datos para que luego básicamente se comporte como un clasificador binario entre dos clases: muestras anómalas y muestras no anómalas (los datos que comparten características comunes).

Regresión

La predicción de precios de venta de departamentos o el stock son ejemplos de regresión.

Aprendizaje no supervisado

Los puntos de datos no tienen etiquetas asociadas a ellos. En cambio, el objetivo de un algoritmo de aprendizaje no supervisado es organizar los datos de alguna manera o de describir su estructura. Esto puede significar agruparlos o encontrar diferentes formas de ver datos complejos para que parezcan más simples.

Agrupación

Resumen

Usamos métodos de aprendizaje supervisado cuando tenemos información sobre el valor que deseamos predecir y métodos de aprendizaje no supervisado cuando no.

La mayoría de los fundamentos teóricos de los algoritmos de aprendizaje automático disponibles en el ecosistema son públicos y se encuentran bien documentados. Microsoft Azure Machine Learning Studio nos ofrece algunas implementaciones de los principales algoritmos de aprendizaje automático existentes, pero vale mencionar que no son todos los que existen.

Fuente: https://machinelearningmastery.com

Nota: Actualmente no tengo ni idea de cuantos algoritmos de aprendizaje puedan existir 😂!

Agregue un comentario

Su dirección de correo no se hará público.