Machine Learning & Deep Learning — Dashboard Interactivo USIL

¿Qué es el Machine Learning?

Fundamento teórico de la sesión

🤖

Definición de Machine Learning

El Machine Learning (aprendizaje automático) es un subcampo de la Inteligencia Artificial que se centra en el desarrollo de algoritmos y modelos que permiten a las computadoras aprender y mejorar su rendimiento en tareas específicas a través de la experiencia, sin ser programadas explícitamente.

Subcampo de la IA

🌊

¿Qué es el Deep Learning?

El Deep Learning es un subconjunto del Machine Learning que utiliza redes neuronales artificiales con múltiples capas para aprender patrones complejos en los datos. Está inspirado en la estructura del cerebro humano y puede adaptarse con mínima intervención humana.

Subconjunto del ML

🧠

Redes Neuronales Artificiales

Son modelos computacionales inspirados en el cerebro humano, compuestos por neuronas artificiales organizadas en capas: entrada, ocultas y salida. Cada conexión tiene un peso ajustable que permite al sistema aprender representaciones complejas de datos.

Base del Deep Learning

Tipos de Aprendizaje Automático

Selecciona cada tipo para explorar su definición, características y casos de uso

🏷️ Aprendizaje Supervisado

¿En qué consiste?

Enfoque dentro del ML donde se entrena un modelo utilizando un conjunto de datos con ejemplos etiquetados. Cada ejemplo consiste en una entrada (características) y la salida deseada correspondiente (etiqueta o clase).

El objetivo es aprender una función que pueda mapear entradas a salidas correctas, permitiendo hacer predicciones precisas sobre datos nuevos no vistos.

📌 Tipos de problemas

🏷️ Clasificación: La salida es una etiqueta discreta (spam/no spam, positivo/negativo).
📈 Regresión: La salida es un valor numérico continuo (precio de una casa, temperatura futura).

📧 Clasificación: Filtro de Spam

El modelo aprende a distinguir entre correos spam y legítimos basándose en características como contenido y remitente. Salida: clase discreta (spam / no spam).

🔵 Clasificación

🏠 Regresión: Precio de Casas

El modelo predice el precio de una propiedad en función de características como tamaño, número de habitaciones y ubicación. Salida: valor numérico continuo.

🟠 Regresión

🩺 Clasificación: Diagnóstico Médico

Clasificar si una imagen médica muestra tejido tumoral o sano, basándose en miles de imágenes etiquetadas por especialistas.

🔵 Clasificación

🔀 Aprendizaje Semi-Supervisado

¿En qué consiste?

Combina el uso de datos etiquetados y no etiquetados para entrenar un algoritmo. Se utiliza cuando no es fácil contar con un conjunto completo de datos etiquetados.

Aprovecha la eficiencia del aprendizaje supervisado junto con la capacidad de generalización del no supervisado, siendo ideal cuando etiquetar datos es costoso o difícil.

📌 Técnicas principales

📉 Reducción de dimensionalidad: Reduce variables para mejorar rendimiento y visualización.
🖼️ Reconocimiento de imágenes: Etiqueta manual de algunas imágenes; el modelo extiende al resto.
💬 Análisis de opinión: Etiqueta comentarios parcialmente para luego generalizar al dataset completo.

🖼️ Reconocimiento de Imágenes Parcial

Se etiquetan manualmente algunas imágenes y se entrena un modelo supervisado. Luego ese modelo etiqueta el conjunto restante de datos no etiquetados automáticamente.

🟡 Semi-supervisado

💬 Análisis de Sentimientos

Se etiquetan manualmente algunos comentarios de clientes como positivos o negativos. El modelo aprende el patrón y clasifica automáticamente las miles de reseñas restantes.

🟡 Semi-supervisado

📉 Reducción Dimensional

Cuando se trabaja con grandes volúmenes de datos se reducen las variables usando técnicas matemáticas y estadísticas para mejorar la velocidad de entrenamiento y la visualización.

🟡 Semi-supervisado

🔍 Aprendizaje No Supervisado

¿En qué consiste?

El modelo se entrena con conjuntos de datos sin etiquetas de salida. El objetivo principal es encontrar patrones, estructuras o relaciones intrínsecas dentro de los datos sin guía externa.

No se conoce la respuesta correcta de antemano; el algoritmo explora los datos libremente y descubre agrupaciones o asociaciones ocultas.

📌 Técnicas principales

🗂️ Agrupamiento (Clustering): Agrupa datos en conjuntos homogéneos por similitud sin etiquetas previas.
📉 Reducción de dimensionalidad: Representa datos en espacios de menor dimensión conservando información relevante.
🔗 Asociación: Identifica relaciones frecuentes (p. ej. "quien compra X también compra Y").

🗂️ Clustering — Segmentación de Clientes

Un banco agrupa a sus clientes en segmentos sin etiquetarlos previamente: jóvenes ahorradores, inversores activos, usuarios de crédito. El algoritmo descubre los grupos por sí solo.

🟢 Clustering

📉 PCA — Reducción de Dimensiones

Técnica matemática que reduce cientos de variables a las más importantes, mejorando visualización, reduciendo ruido y acelerando el entrenamiento de modelos posteriores.

🟢 Reducción dimensional

🛒 Reglas de Asociación — Market Basket

Amazon descubre que "las personas que compran pañales también compran cerveza los viernes". Este patrón permite recomendaciones cruzadas sin supervisión humana previa.

🟢 Asociación

🎮 Aprendizaje por Refuerzo

¿En qué consiste?

Un agente aprende a tomar decisiones a través de la interacción con un entorno. Recibe recompensas por acciones correctas y penalizaciones por incorrectas. Útil cuando las acciones tienen consecuencias a largo plazo.

Algunos algoritmos comunes: Q-Learning, Deep Reinforcement Learning y Policy Gradient Methods.

📌 El ciclo de aprendizaje

👁️ Observar: El agente observa el estado actual del entorno.
🎯 Seleccionar acción: Elige una acción basándose en su política actual.
⚡ Ejecutar y observar: Actúa y recibe una recompensa + nuevo estado.
🔄 Actualizar política: Mejora su estrategia con la retroalimentación recibida.

🎮 Videojuegos — AlphaGo

DeepMind entrenó un agente que aprendió a jugar Go (juego con más posibilidades que átomos en el universo) únicamente jugando contra sí mismo millones de veces.

🟣 Por Refuerzo

🚗 Vehículos Autónomos

El agente aprende a navegar en carreteras: recibe recompensas por avanzar correctamente y penalizaciones por infracciones. Con millones de iteraciones domina la conducción segura.

🟣 Por Refuerzo

🤖 Robótica Industrial

Un brazo robótico aprende a ensamblar piezas: prueba movimientos, recibe recompensa cuando encajan correctamente y ajusta su política hasta perfeccionar la tarea.

🟣 Por Refuerzo

Proceso del Machine Learning

El ciclo completo desde los datos hasta la predicción

📦1

Datos

Recolección y limpieza

→

🏋️2

Preprocesamiento

Normalización y selección

→

🏗️3

Entrenamiento

Algoritmo aprende

→

🧪4

Evaluación

Mide precisión

→

🧠5

Modelo

Patrones aprendidos

→

🎯6

Predicción

Nuevas respuestas

📦 Datos de entrada

Historial de emails, imágenes médicas, transacciones bancarias. La calidad de los datos determina la calidad del modelo.

🏋️ Preprocesamiento

Limpieza de datos faltantes, normalización de escalas, codificación de variables categóricas. Herramientas: Pandas, NumPy.

🏗️ Entrenamiento

El algoritmo ajusta sus parámetros internos para minimizar errores usando técnicas como Gradient Descent o Backpropagation.

🧪 Evaluación

Se mide la precisión con datos de prueba no vistos. Métricas: accuracy, F1-score, RMSE, AUC-ROC según el tipo de problema.

🧠 Modelo resultante

Conjunto de pesos matemáticos o reglas aprendidas que capturan los patrones de los datos. Puede ser serializado y desplegado.

🎯 Predicción / Inferencia

El modelo clasifica spam, recomienda películas, detecta fraudes o predice precios de propiedades sobre datos completamente nuevos.

Herramientas de Machine Learning

Haz clic en cualquier herramienta para conocer más detalles

🐍

Ecosistema Python

Bibliotecas y frameworks principales

🐍

Python

Lenguaje principal del ecosistema ML. Sencillo, legible y con enorme comunidad.

🔢

NumPy & Pandas

Manipulación y análisis de datos estructurados y matrices numéricas.

⚙️

Scikit-learn

Algoritmos clásicos de ML: regresión, clasificación, clustering y más.

🔶

TensorFlow & Keras

Framework de Google para aprendizaje profundo y redes neuronales a gran escala.

🔥

PyTorch

Framework de Meta. Favorito en investigación por su flexibilidad y sintaxis dinámica.

📊

Matplotlib & Seaborn

Visualización de datos, gráficos estadísticos y exploración visual de resultados.

☁️

Plataformas y Big Data

Entornos de desarrollo y nube

📓

Jupyter Notebooks

Entorno interactivo para explorar datos, prototipar modelos y compartir resultados.

📈

Plotly / Bokeh / Altair

Visualizaciones interactivas avanzadas para comunicar hallazgos de datos.

⚡

Apache Spark & Hadoop

Procesamiento distribuido de grandes volúmenes de datos (Big Data).

🌐

Google Cloud AI Platform

Entrenamiento y despliegue de modelos ML a escala en infraestructura de Google.

🟠

Amazon SageMaker

Plataforma end-to-end de AWS para construir, entrenar y desplegar modelos ML.

🔷

Azure ML / IBM Watson

Plataformas empresariales de Microsoft e IBM para ML en la nube con AutoML.

Redes Neuronales Artificiales

El corazón del Deep Learning — estructura, capas y funcionamiento

¿Qué son las Redes Neuronales?

Son modelos computacionales inspirados en la estructura y función del cerebro humano. Se utilizan en Machine Learning e IA para realizar tareas como reconocimiento de patrones, clasificación, regresión, procesamiento de lenguaje natural y visión por computadora.

Cada neurona artificial está conectada a las neuronas de capas adyacentes a través de conexiones llamadas pesos, que se ajustan durante el entrenamiento para aprender representaciones de los datos.

📥

Capa de Entrada (Input Layer)

Recibe los datos crudos: píxeles de imagen, palabras de texto, valores numéricos. Ingreso de datos para analizar.

🔄

Capas Ocultas (Hidden Layers)

Procesan la información mediante algoritmos computacionales. En Deep Learning hay múltiples capas ocultas que aprenden representaciones jerárquicas.

📤

Capa de Salida (Output Layer)

Produce el resultado final: clase predicha, valor numérico o probabilidades. Análisis de resultados esperados.

🧬 Arquitectura de una Red Neuronal

Ejemplos de ML y Deep Learning

Haz clic en cada tarjeta para ver la explicación completa

📊 Machine Learning

🎬

Netflix — Sistema de Recomendación

ML para recomendar contenido personalizado según historial de visualización.

▼ Ver más

Netflix usa filtrado colaborativo (ML supervisado y no supervisado combinado): analiza patrones de millones de usuarios con gustos similares y sugiere series o películas con alta probabilidad de gustar. El modelo se actualiza en tiempo real con cada interacción.

🛒

Amazon — Recomendación de Productos

Algoritmos que aprenden tus preferencias de compra para sugerir productos relevantes.

▼ Ver más

Amazon emplea filtrado basado en contenido y colaborativo: compara tu historial de compras con el de usuarios similares. El sistema aprende que "quien compra impresora también necesita tinta" sin que nadie lo programe explícitamente.

📧

Gmail — Filtro de Spam

Clasificación automática de correos no deseados mediante ML supervisado.

▼ Ver más

Gmail usa clasificadores de ML (Naive Bayes, redes neuronales poco profundas) entrenados con millones de correos etiquetados. El sistema aprende patrones de palabras, remitentes y comportamiento del usuario para bloquear spam con más del 99% de precisión.

💳

Visa / Mastercard — Detección de Fraude

ML detecta transacciones fraudulentas en milisegundos analizando miles de variables.

▼ Ver más

Los procesadores de pago usan modelos de clasificación ML que analizan en tiempo real: ubicación geográfica, dispositivo, monto, historial, hora. Si el patrón es anómalo (compra en Perú y Japón en 10 min), la transacción se bloquea automáticamente.

🌊 Deep Learning

💬

ChatGPT — Modelo de Lenguaje

LLM basado en arquitectura Transformer (Deep Learning) entrenado con texto masivo.

▼ Ver más

ChatGPT usa la arquitectura Transformer, un tipo de red neuronal profunda que procesa secuencias de texto. Entrenado con cientos de miles de millones de palabras, aprende patrones estadísticos del lenguaje humano para predecir el siguiente token de manera coherente y contextual.

📸

Facebook / Google — Reconocimiento de Imágenes

CNN (Redes Neuronales Convolucionales) para identificar objetos y personas en fotos.

▼ Ver más

Los sistemas de reconocimiento visual usan CNN (Convolutional Neural Networks), una arquitectura de DL que procesa imágenes en capas jerárquicas: bordes → formas → objetos → personas. Facebook las usa para etiquetar rostros; Google Photos para buscar "perro" entre miles de fotos.

🚗

Tesla / Waymo — Conducción Autónoma

Deep Learning procesa datos de cámaras y sensores para conducir sin intervención humana.

▼ Ver más

Los autos autónomos combinan CNN para visión, RNN para secuencias temporales y RL para decisiones: detectan peatones, señales, líneas de carril y otros vehículos en tiempo real. Cada kilómetro recorrido aporta nuevos datos para mejorar el modelo de Deep Learning.

🌐

Google Translate — Traducción Automática

Redes neuronales secuenciales (Transformers) que traducen entre más de 100 idiomas.

▼ Ver más

Google Translate migró de reglas estadísticas a redes neuronales de traducción (NMT) basadas en Transformers. El modelo aprende el contexto completo de una oración, no palabra por palabra, logrando traducciones mucho más naturales y precisas que los sistemas anteriores.

Machine Learning vs Deep Learning

Comparación de características clave entre ambas tecnologías

Criterio	📊 Machine Learning	🌊 Deep Learning
Definición	Término amplio: cualquier algoritmo que aprenda de datos. Incluye regresión, árboles, SVM, clustering.	Subconjunto del ML que usa redes neuronales artificiales con múltiples capas ocultas (profundas).
Datos necesarios	Puede funcionar bien con datasets medianos (miles de ejemplos). Requiere ingeniería de características manual.	Requiere grandes volúmenes de datos (millones de ejemplos). Aprende características automáticamente.
Ingeniería de características	Necesita que expertos seleccionen y transformen las variables relevantes (feature engineering).	Aprende sus propias representaciones jerárquicas de los datos sin intervención humana explícita.
Poder computacional	Generalmente puede entrenarse en CPU. Menor consumo de recursos computacionales.	Requiere GPUs o TPUs potentes. Tiempos de entrenamiento de horas o días para modelos grandes.
Interpretabilidad	Mayor: árboles de decisión y regresión logística son fáciles de explicar (white box).	Menor: las redes neuronales son "cajas negras". Difícil explicar por qué tomó una decisión.
Intervención humana	Puede necesitar intervención para corregir errores. El experto revisa y ajusta características.	Se adapta con poca o ninguna intervención humana. Mayor autonomía una vez entrenado.
Casos de uso principales	Predicción de precios, detección de fraude, clasificación de texto, recomendaciones básicas.	Visión por computadora, procesamiento de lenguaje natural, audio, vehículos autónomos, generative AI.
Ejemplos conocidos	Filtro spam Gmail, detección fraude Visa, recomendaciones Spotify/Amazon.	ChatGPT, Tesla Autopilot, reconocimiento facial, Google Translate, DALL-E.

Quiz — Pon a prueba tu aprendizaje

10 preguntas sobre Machine Learning y Deep Learning con retroalimentación inmediata

Pregunta 1 de 10

0/10