Definición de Machine Learning
El Machine Learning (aprendizaje automático) es un subcampo de la Inteligencia Artificial que se centra en el desarrollo de algoritmos y modelos que permiten a las computadoras aprender y mejorar su rendimiento en tareas específicas a través de la experiencia, sin ser programadas explícitamente.
Subcampo de la IA¿Qué es el Deep Learning?
El Deep Learning es un subconjunto del Machine Learning que utiliza redes neuronales artificiales con múltiples capas para aprender patrones complejos en los datos. Está inspirado en la estructura del cerebro humano y puede adaptarse con mínima intervención humana.
Subconjunto del MLRedes Neuronales Artificiales
Son modelos computacionales inspirados en el cerebro humano, compuestos por neuronas artificiales organizadas en capas: entrada, ocultas y salida. Cada conexión tiene un peso ajustable que permite al sistema aprender representaciones complejas de datos.
Base del Deep Learning¿En qué consiste?
Enfoque dentro del ML donde se entrena un modelo utilizando un conjunto de datos con ejemplos etiquetados. Cada ejemplo consiste en una entrada (características) y la salida deseada correspondiente (etiqueta o clase).
El objetivo es aprender una función que pueda mapear entradas a salidas correctas, permitiendo hacer predicciones precisas sobre datos nuevos no vistos.
- 🏷️ Clasificación: La salida es una etiqueta discreta (spam/no spam, positivo/negativo).
- 📈 Regresión: La salida es un valor numérico continuo (precio de una casa, temperatura futura).
📧 Clasificación: Filtro de Spam
El modelo aprende a distinguir entre correos spam y legítimos basándose en características como contenido y remitente. Salida: clase discreta (spam / no spam).
🔵 Clasificación🏠 Regresión: Precio de Casas
El modelo predice el precio de una propiedad en función de características como tamaño, número de habitaciones y ubicación. Salida: valor numérico continuo.
🟠 Regresión🩺 Clasificación: Diagnóstico Médico
Clasificar si una imagen médica muestra tejido tumoral o sano, basándose en miles de imágenes etiquetadas por especialistas.
🔵 Clasificación¿En qué consiste?
Combina el uso de datos etiquetados y no etiquetados para entrenar un algoritmo. Se utiliza cuando no es fácil contar con un conjunto completo de datos etiquetados.
Aprovecha la eficiencia del aprendizaje supervisado junto con la capacidad de generalización del no supervisado, siendo ideal cuando etiquetar datos es costoso o difícil.
- 📉 Reducción de dimensionalidad: Reduce variables para mejorar rendimiento y visualización.
- 🖼️ Reconocimiento de imágenes: Etiqueta manual de algunas imágenes; el modelo extiende al resto.
- 💬 Análisis de opinión: Etiqueta comentarios parcialmente para luego generalizar al dataset completo.
🖼️ Reconocimiento de Imágenes Parcial
Se etiquetan manualmente algunas imágenes y se entrena un modelo supervisado. Luego ese modelo etiqueta el conjunto restante de datos no etiquetados automáticamente.
🟡 Semi-supervisado💬 Análisis de Sentimientos
Se etiquetan manualmente algunos comentarios de clientes como positivos o negativos. El modelo aprende el patrón y clasifica automáticamente las miles de reseñas restantes.
🟡 Semi-supervisado📉 Reducción Dimensional
Cuando se trabaja con grandes volúmenes de datos se reducen las variables usando técnicas matemáticas y estadísticas para mejorar la velocidad de entrenamiento y la visualización.
🟡 Semi-supervisado¿En qué consiste?
El modelo se entrena con conjuntos de datos sin etiquetas de salida. El objetivo principal es encontrar patrones, estructuras o relaciones intrínsecas dentro de los datos sin guía externa.
No se conoce la respuesta correcta de antemano; el algoritmo explora los datos libremente y descubre agrupaciones o asociaciones ocultas.
- 🗂️ Agrupamiento (Clustering): Agrupa datos en conjuntos homogéneos por similitud sin etiquetas previas.
- 📉 Reducción de dimensionalidad: Representa datos en espacios de menor dimensión conservando información relevante.
- 🔗 Asociación: Identifica relaciones frecuentes (p. ej. "quien compra X también compra Y").
🗂️ Clustering — Segmentación de Clientes
Un banco agrupa a sus clientes en segmentos sin etiquetarlos previamente: jóvenes ahorradores, inversores activos, usuarios de crédito. El algoritmo descubre los grupos por sí solo.
🟢 Clustering📉 PCA — Reducción de Dimensiones
Técnica matemática que reduce cientos de variables a las más importantes, mejorando visualización, reduciendo ruido y acelerando el entrenamiento de modelos posteriores.
🟢 Reducción dimensional🛒 Reglas de Asociación — Market Basket
Amazon descubre que "las personas que compran pañales también compran cerveza los viernes". Este patrón permite recomendaciones cruzadas sin supervisión humana previa.
🟢 Asociación¿En qué consiste?
Un agente aprende a tomar decisiones a través de la interacción con un entorno. Recibe recompensas por acciones correctas y penalizaciones por incorrectas. Útil cuando las acciones tienen consecuencias a largo plazo.
Algunos algoritmos comunes: Q-Learning, Deep Reinforcement Learning y Policy Gradient Methods.
- 👁️ Observar: El agente observa el estado actual del entorno.
- 🎯 Seleccionar acción: Elige una acción basándose en su política actual.
- ⚡ Ejecutar y observar: Actúa y recibe una recompensa + nuevo estado.
- 🔄 Actualizar política: Mejora su estrategia con la retroalimentación recibida.
🎮 Videojuegos — AlphaGo
DeepMind entrenó un agente que aprendió a jugar Go (juego con más posibilidades que átomos en el universo) únicamente jugando contra sí mismo millones de veces.
🟣 Por Refuerzo🚗 Vehículos Autónomos
El agente aprende a navegar en carreteras: recibe recompensas por avanzar correctamente y penalizaciones por infracciones. Con millones de iteraciones domina la conducción segura.
🟣 Por Refuerzo🤖 Robótica Industrial
Un brazo robótico aprende a ensamblar piezas: prueba movimientos, recibe recompensa cuando encajan correctamente y ajusta su política hasta perfeccionar la tarea.
🟣 Por Refuerzo¿Qué son las Redes Neuronales?
Son modelos computacionales inspirados en la estructura y función del cerebro humano. Se utilizan en Machine Learning e IA para realizar tareas como reconocimiento de patrones, clasificación, regresión, procesamiento de lenguaje natural y visión por computadora.
Cada neurona artificial está conectada a las neuronas de capas adyacentes a través de conexiones llamadas pesos, que se ajustan durante el entrenamiento para aprender representaciones de los datos.
🧬 Arquitectura de una Red Neuronal
Netflix usa filtrado colaborativo (ML supervisado y no supervisado combinado): analiza patrones de millones de usuarios con gustos similares y sugiere series o películas con alta probabilidad de gustar. El modelo se actualiza en tiempo real con cada interacción.
Amazon emplea filtrado basado en contenido y colaborativo: compara tu historial de compras con el de usuarios similares. El sistema aprende que "quien compra impresora también necesita tinta" sin que nadie lo programe explícitamente.
Gmail usa clasificadores de ML (Naive Bayes, redes neuronales poco profundas) entrenados con millones de correos etiquetados. El sistema aprende patrones de palabras, remitentes y comportamiento del usuario para bloquear spam con más del 99% de precisión.
Los procesadores de pago usan modelos de clasificación ML que analizan en tiempo real: ubicación geográfica, dispositivo, monto, historial, hora. Si el patrón es anómalo (compra en Perú y Japón en 10 min), la transacción se bloquea automáticamente.
ChatGPT usa la arquitectura Transformer, un tipo de red neuronal profunda que procesa secuencias de texto. Entrenado con cientos de miles de millones de palabras, aprende patrones estadísticos del lenguaje humano para predecir el siguiente token de manera coherente y contextual.
Los sistemas de reconocimiento visual usan CNN (Convolutional Neural Networks), una arquitectura de DL que procesa imágenes en capas jerárquicas: bordes → formas → objetos → personas. Facebook las usa para etiquetar rostros; Google Photos para buscar "perro" entre miles de fotos.
Los autos autónomos combinan CNN para visión, RNN para secuencias temporales y RL para decisiones: detectan peatones, señales, líneas de carril y otros vehículos en tiempo real. Cada kilómetro recorrido aporta nuevos datos para mejorar el modelo de Deep Learning.
Google Translate migró de reglas estadísticas a redes neuronales de traducción (NMT) basadas en Transformers. El modelo aprende el contexto completo de una oración, no palabra por palabra, logrando traducciones mucho más naturales y precisas que los sistemas anteriores.
| Criterio | 📊 Machine Learning | 🌊 Deep Learning |
|---|---|---|
| Definición | Término amplio: cualquier algoritmo que aprenda de datos. Incluye regresión, árboles, SVM, clustering. | Subconjunto del ML que usa redes neuronales artificiales con múltiples capas ocultas (profundas). |
| Datos necesarios | Puede funcionar bien con datasets medianos (miles de ejemplos). Requiere ingeniería de características manual. | Requiere grandes volúmenes de datos (millones de ejemplos). Aprende características automáticamente. |
| Ingeniería de características | Necesita que expertos seleccionen y transformen las variables relevantes (feature engineering). | Aprende sus propias representaciones jerárquicas de los datos sin intervención humana explícita. |
| Poder computacional | Generalmente puede entrenarse en CPU. Menor consumo de recursos computacionales. | Requiere GPUs o TPUs potentes. Tiempos de entrenamiento de horas o días para modelos grandes. |
| Interpretabilidad | Mayor: árboles de decisión y regresión logística son fáciles de explicar (white box). | Menor: las redes neuronales son "cajas negras". Difícil explicar por qué tomó una decisión. |
| Intervención humana | Puede necesitar intervención para corregir errores. El experto revisa y ajusta características. | Se adapta con poca o ninguna intervención humana. Mayor autonomía una vez entrenado. |
| Casos de uso principales | Predicción de precios, detección de fraude, clasificación de texto, recomendaciones básicas. | Visión por computadora, procesamiento de lenguaje natural, audio, vehículos autónomos, generative AI. |
| Ejemplos conocidos | Filtro spam Gmail, detección fraude Visa, recomendaciones Spotify/Amazon. | ChatGPT, Tesla Autopilot, reconocimiento facial, Google Translate, DALL-E. |