📚 Fundamentos en Competencias Digitales · USIL · Semana 10

Machine Learning
& Deep Learning

Dashboard educativo interactivo — Sesión 5

Explora los tipos de aprendizaje automático, las herramientas del ecosistema ML, el funcionamiento de las redes neuronales y los casos de uso reales que están transformando industrias enteras.

📊 Machine Learning
🌊 Deep Learning
🧬 Redes Neuronales
¿Qué es el Machine Learning?
Fundamento teórico de la sesión
01
🤖

Definición de Machine Learning

El Machine Learning (aprendizaje automático) es un subcampo de la Inteligencia Artificial que se centra en el desarrollo de algoritmos y modelos que permiten a las computadoras aprender y mejorar su rendimiento en tareas específicas a través de la experiencia, sin ser programadas explícitamente.

Subcampo de la IA
02
🌊

¿Qué es el Deep Learning?

El Deep Learning es un subconjunto del Machine Learning que utiliza redes neuronales artificiales con múltiples capas para aprender patrones complejos en los datos. Está inspirado en la estructura del cerebro humano y puede adaptarse con mínima intervención humana.

Subconjunto del ML
03
🧠

Redes Neuronales Artificiales

Son modelos computacionales inspirados en el cerebro humano, compuestos por neuronas artificiales organizadas en capas: entrada, ocultas y salida. Cada conexión tiene un peso ajustable que permite al sistema aprender representaciones complejas de datos.

Base del Deep Learning
Tipos de Aprendizaje Automático
Selecciona cada tipo para explorar su definición, características y casos de uso
🏷️ Aprendizaje Supervisado

¿En qué consiste?

Enfoque dentro del ML donde se entrena un modelo utilizando un conjunto de datos con ejemplos etiquetados. Cada ejemplo consiste en una entrada (características) y la salida deseada correspondiente (etiqueta o clase).

El objetivo es aprender una función que pueda mapear entradas a salidas correctas, permitiendo hacer predicciones precisas sobre datos nuevos no vistos.

📌 Tipos de problemas
  • 🏷️ Clasificación: La salida es una etiqueta discreta (spam/no spam, positivo/negativo).
  • 📈 Regresión: La salida es un valor numérico continuo (precio de una casa, temperatura futura).

📧 Clasificación: Filtro de Spam

El modelo aprende a distinguir entre correos spam y legítimos basándose en características como contenido y remitente. Salida: clase discreta (spam / no spam).

🔵 Clasificación

🏠 Regresión: Precio de Casas

El modelo predice el precio de una propiedad en función de características como tamaño, número de habitaciones y ubicación. Salida: valor numérico continuo.

🟠 Regresión

🩺 Clasificación: Diagnóstico Médico

Clasificar si una imagen médica muestra tejido tumoral o sano, basándose en miles de imágenes etiquetadas por especialistas.

🔵 Clasificación
🔀 Aprendizaje Semi-Supervisado

¿En qué consiste?

Combina el uso de datos etiquetados y no etiquetados para entrenar un algoritmo. Se utiliza cuando no es fácil contar con un conjunto completo de datos etiquetados.

Aprovecha la eficiencia del aprendizaje supervisado junto con la capacidad de generalización del no supervisado, siendo ideal cuando etiquetar datos es costoso o difícil.

📌 Técnicas principales
  • 📉 Reducción de dimensionalidad: Reduce variables para mejorar rendimiento y visualización.
  • 🖼️ Reconocimiento de imágenes: Etiqueta manual de algunas imágenes; el modelo extiende al resto.
  • 💬 Análisis de opinión: Etiqueta comentarios parcialmente para luego generalizar al dataset completo.

🖼️ Reconocimiento de Imágenes Parcial

Se etiquetan manualmente algunas imágenes y se entrena un modelo supervisado. Luego ese modelo etiqueta el conjunto restante de datos no etiquetados automáticamente.

🟡 Semi-supervisado

💬 Análisis de Sentimientos

Se etiquetan manualmente algunos comentarios de clientes como positivos o negativos. El modelo aprende el patrón y clasifica automáticamente las miles de reseñas restantes.

🟡 Semi-supervisado

📉 Reducción Dimensional

Cuando se trabaja con grandes volúmenes de datos se reducen las variables usando técnicas matemáticas y estadísticas para mejorar la velocidad de entrenamiento y la visualización.

🟡 Semi-supervisado
🔍 Aprendizaje No Supervisado

¿En qué consiste?

El modelo se entrena con conjuntos de datos sin etiquetas de salida. El objetivo principal es encontrar patrones, estructuras o relaciones intrínsecas dentro de los datos sin guía externa.

No se conoce la respuesta correcta de antemano; el algoritmo explora los datos libremente y descubre agrupaciones o asociaciones ocultas.

📌 Técnicas principales
  • 🗂️ Agrupamiento (Clustering): Agrupa datos en conjuntos homogéneos por similitud sin etiquetas previas.
  • 📉 Reducción de dimensionalidad: Representa datos en espacios de menor dimensión conservando información relevante.
  • 🔗 Asociación: Identifica relaciones frecuentes (p. ej. "quien compra X también compra Y").

🗂️ Clustering — Segmentación de Clientes

Un banco agrupa a sus clientes en segmentos sin etiquetarlos previamente: jóvenes ahorradores, inversores activos, usuarios de crédito. El algoritmo descubre los grupos por sí solo.

🟢 Clustering

📉 PCA — Reducción de Dimensiones

Técnica matemática que reduce cientos de variables a las más importantes, mejorando visualización, reduciendo ruido y acelerando el entrenamiento de modelos posteriores.

🟢 Reducción dimensional

🛒 Reglas de Asociación — Market Basket

Amazon descubre que "las personas que compran pañales también compran cerveza los viernes". Este patrón permite recomendaciones cruzadas sin supervisión humana previa.

🟢 Asociación
🎮 Aprendizaje por Refuerzo

¿En qué consiste?

Un agente aprende a tomar decisiones a través de la interacción con un entorno. Recibe recompensas por acciones correctas y penalizaciones por incorrectas. Útil cuando las acciones tienen consecuencias a largo plazo.

Algunos algoritmos comunes: Q-Learning, Deep Reinforcement Learning y Policy Gradient Methods.

📌 El ciclo de aprendizaje
  • 👁️ Observar: El agente observa el estado actual del entorno.
  • 🎯 Seleccionar acción: Elige una acción basándose en su política actual.
  • Ejecutar y observar: Actúa y recibe una recompensa + nuevo estado.
  • 🔄 Actualizar política: Mejora su estrategia con la retroalimentación recibida.

🎮 Videojuegos — AlphaGo

DeepMind entrenó un agente que aprendió a jugar Go (juego con más posibilidades que átomos en el universo) únicamente jugando contra sí mismo millones de veces.

🟣 Por Refuerzo

🚗 Vehículos Autónomos

El agente aprende a navegar en carreteras: recibe recompensas por avanzar correctamente y penalizaciones por infracciones. Con millones de iteraciones domina la conducción segura.

🟣 Por Refuerzo

🤖 Robótica Industrial

Un brazo robótico aprende a ensamblar piezas: prueba movimientos, recibe recompensa cuando encajan correctamente y ajusta su política hasta perfeccionar la tarea.

🟣 Por Refuerzo
Proceso del Machine Learning
El ciclo completo desde los datos hasta la predicción
📦1
Datos
Recolección y limpieza
🏋️2
Preprocesamiento
Normalización y selección
🏗️3
Entrenamiento
Algoritmo aprende
🧪4
Evaluación
Mide precisión
🧠5
Modelo
Patrones aprendidos
🎯6
Predicción
Nuevas respuestas
📦 Datos de entrada
Historial de emails, imágenes médicas, transacciones bancarias. La calidad de los datos determina la calidad del modelo.
🏋️ Preprocesamiento
Limpieza de datos faltantes, normalización de escalas, codificación de variables categóricas. Herramientas: Pandas, NumPy.
🏗️ Entrenamiento
El algoritmo ajusta sus parámetros internos para minimizar errores usando técnicas como Gradient Descent o Backpropagation.
🧪 Evaluación
Se mide la precisión con datos de prueba no vistos. Métricas: accuracy, F1-score, RMSE, AUC-ROC según el tipo de problema.
🧠 Modelo resultante
Conjunto de pesos matemáticos o reglas aprendidas que capturan los patrones de los datos. Puede ser serializado y desplegado.
🎯 Predicción / Inferencia
El modelo clasifica spam, recomienda películas, detecta fraudes o predice precios de propiedades sobre datos completamente nuevos.
Herramientas de Machine Learning
Haz clic en cualquier herramienta para conocer más detalles
🐍
Ecosistema Python
Bibliotecas y frameworks principales
🐍
Python
Lenguaje principal del ecosistema ML. Sencillo, legible y con enorme comunidad.
🔢
NumPy & Pandas
Manipulación y análisis de datos estructurados y matrices numéricas.
⚙️
Scikit-learn
Algoritmos clásicos de ML: regresión, clasificación, clustering y más.
🔶
TensorFlow & Keras
Framework de Google para aprendizaje profundo y redes neuronales a gran escala.
🔥
PyTorch
Framework de Meta. Favorito en investigación por su flexibilidad y sintaxis dinámica.
📊
Matplotlib & Seaborn
Visualización de datos, gráficos estadísticos y exploración visual de resultados.
☁️
Plataformas y Big Data
Entornos de desarrollo y nube
📓
Jupyter Notebooks
Entorno interactivo para explorar datos, prototipar modelos y compartir resultados.
📈
Plotly / Bokeh / Altair
Visualizaciones interactivas avanzadas para comunicar hallazgos de datos.
Apache Spark & Hadoop
Procesamiento distribuido de grandes volúmenes de datos (Big Data).
🌐
Google Cloud AI Platform
Entrenamiento y despliegue de modelos ML a escala en infraestructura de Google.
🟠
Amazon SageMaker
Plataforma end-to-end de AWS para construir, entrenar y desplegar modelos ML.
🔷
Azure ML / IBM Watson
Plataformas empresariales de Microsoft e IBM para ML en la nube con AutoML.

Redes Neuronales Artificiales
El corazón del Deep Learning — estructura, capas y funcionamiento

¿Qué son las Redes Neuronales?

Son modelos computacionales inspirados en la estructura y función del cerebro humano. Se utilizan en Machine Learning e IA para realizar tareas como reconocimiento de patrones, clasificación, regresión, procesamiento de lenguaje natural y visión por computadora.

Cada neurona artificial está conectada a las neuronas de capas adyacentes a través de conexiones llamadas pesos, que se ajustan durante el entrenamiento para aprender representaciones de los datos.

📥
Capa de Entrada (Input Layer)
Recibe los datos crudos: píxeles de imagen, palabras de texto, valores numéricos. Ingreso de datos para analizar.
🔄
Capas Ocultas (Hidden Layers)
Procesan la información mediante algoritmos computacionales. En Deep Learning hay múltiples capas ocultas que aprenden representaciones jerárquicas.
📤
Capa de Salida (Output Layer)
Produce el resultado final: clase predicha, valor numérico o probabilidades. Análisis de resultados esperados.

🧬 Arquitectura de una Red Neuronal

Entrada Oculta Salida x₁ x₂ x₃ xₙ h₁ h₂ hₘ ŷ Datos de entrada Procesamiento algorítmico Resultado esperado pesos (w)
Ejemplos de ML y Deep Learning
Haz clic en cada tarjeta para ver la explicación completa
📊 Machine Learning
🎬
Netflix — Sistema de Recomendación
ML para recomendar contenido personalizado según historial de visualización.
▼ Ver más

Netflix usa filtrado colaborativo (ML supervisado y no supervisado combinado): analiza patrones de millones de usuarios con gustos similares y sugiere series o películas con alta probabilidad de gustar. El modelo se actualiza en tiempo real con cada interacción.

🛒
Amazon — Recomendación de Productos
Algoritmos que aprenden tus preferencias de compra para sugerir productos relevantes.
▼ Ver más

Amazon emplea filtrado basado en contenido y colaborativo: compara tu historial de compras con el de usuarios similares. El sistema aprende que "quien compra impresora también necesita tinta" sin que nadie lo programe explícitamente.

📧
Gmail — Filtro de Spam
Clasificación automática de correos no deseados mediante ML supervisado.
▼ Ver más

Gmail usa clasificadores de ML (Naive Bayes, redes neuronales poco profundas) entrenados con millones de correos etiquetados. El sistema aprende patrones de palabras, remitentes y comportamiento del usuario para bloquear spam con más del 99% de precisión.

💳
Visa / Mastercard — Detección de Fraude
ML detecta transacciones fraudulentas en milisegundos analizando miles de variables.
▼ Ver más

Los procesadores de pago usan modelos de clasificación ML que analizan en tiempo real: ubicación geográfica, dispositivo, monto, historial, hora. Si el patrón es anómalo (compra en Perú y Japón en 10 min), la transacción se bloquea automáticamente.

🌊 Deep Learning
💬
ChatGPT — Modelo de Lenguaje
LLM basado en arquitectura Transformer (Deep Learning) entrenado con texto masivo.
▼ Ver más

ChatGPT usa la arquitectura Transformer, un tipo de red neuronal profunda que procesa secuencias de texto. Entrenado con cientos de miles de millones de palabras, aprende patrones estadísticos del lenguaje humano para predecir el siguiente token de manera coherente y contextual.

📸
Facebook / Google — Reconocimiento de Imágenes
CNN (Redes Neuronales Convolucionales) para identificar objetos y personas en fotos.
▼ Ver más

Los sistemas de reconocimiento visual usan CNN (Convolutional Neural Networks), una arquitectura de DL que procesa imágenes en capas jerárquicas: bordes → formas → objetos → personas. Facebook las usa para etiquetar rostros; Google Photos para buscar "perro" entre miles de fotos.

🚗
Tesla / Waymo — Conducción Autónoma
Deep Learning procesa datos de cámaras y sensores para conducir sin intervención humana.
▼ Ver más

Los autos autónomos combinan CNN para visión, RNN para secuencias temporales y RL para decisiones: detectan peatones, señales, líneas de carril y otros vehículos en tiempo real. Cada kilómetro recorrido aporta nuevos datos para mejorar el modelo de Deep Learning.

🌐
Google Translate — Traducción Automática
Redes neuronales secuenciales (Transformers) que traducen entre más de 100 idiomas.
▼ Ver más

Google Translate migró de reglas estadísticas a redes neuronales de traducción (NMT) basadas en Transformers. El modelo aprende el contexto completo de una oración, no palabra por palabra, logrando traducciones mucho más naturales y precisas que los sistemas anteriores.

Machine Learning vs Deep Learning
Comparación de características clave entre ambas tecnologías
Criterio 📊 Machine Learning 🌊 Deep Learning
Definición Término amplio: cualquier algoritmo que aprenda de datos. Incluye regresión, árboles, SVM, clustering. Subconjunto del ML que usa redes neuronales artificiales con múltiples capas ocultas (profundas).
Datos necesarios Puede funcionar bien con datasets medianos (miles de ejemplos). Requiere ingeniería de características manual. Requiere grandes volúmenes de datos (millones de ejemplos). Aprende características automáticamente.
Ingeniería de características Necesita que expertos seleccionen y transformen las variables relevantes (feature engineering). Aprende sus propias representaciones jerárquicas de los datos sin intervención humana explícita.
Poder computacional Generalmente puede entrenarse en CPU. Menor consumo de recursos computacionales. Requiere GPUs o TPUs potentes. Tiempos de entrenamiento de horas o días para modelos grandes.
Interpretabilidad Mayor: árboles de decisión y regresión logística son fáciles de explicar (white box). Menor: las redes neuronales son "cajas negras". Difícil explicar por qué tomó una decisión.
Intervención humana Puede necesitar intervención para corregir errores. El experto revisa y ajusta características. Se adapta con poca o ninguna intervención humana. Mayor autonomía una vez entrenado.
Casos de uso principales Predicción de precios, detección de fraude, clasificación de texto, recomendaciones básicas. Visión por computadora, procesamiento de lenguaje natural, audio, vehículos autónomos, generative AI.
Ejemplos conocidos Filtro spam Gmail, detección fraude Visa, recomendaciones Spotify/Amazon. ChatGPT, Tesla Autopilot, reconocimiento facial, Google Translate, DALL-E.
Quiz — Pon a prueba tu aprendizaje
10 preguntas sobre Machine Learning y Deep Learning con retroalimentación inmediata
1 / 10
Pregunta 1 de 10
0/10