Quinta etapa: Exploración de escenarios de aplicación de la IA
Curso de desarrollo de sistemas RAG de DeepLearning.AI, aprende a construir aplicaciones de generación aumentada de recuperación de nivel de producción utilizando bases de datos vectoriales y LLM, cubriendo el proceso completo desde el diseño de la arquitectura hasta la evaluación de la implementación.
Introducción detallada al curso de Generación Aumentada por Recuperación (RAG)
Resumen del curso
Este es un curso integral sobre sistemas de Generación Aumentada por Recuperación (RAG) ofrecido por DeepLearning.AI, diseñado para ayudar a los estudiantes a dominar el desarrollo de aplicaciones RAG de nivel de producción, desde el diseño de la arquitectura hasta la evaluación de la implementación.
Plataforma del curso: DeepLearning.AI / Coursera
Instructor: Zain Hasan (Ingeniero Senior de AI/ML en Together AI, Profesor en la Universidad de Toronto)
Duración del curso: 5 horas de vídeo + más de 20 horas de práctica de programación
Nivel del curso: Intermedio
Modalidad de estudio: A tu propio ritmo
Presentación del instructor
Zain Hasan es un ingeniero de IA y educador con casi una década de experiencia, habiendo trabajado en:
- Together AI: Como Ingeniero de Relaciones de Desarrollo de AI/ML
- Weaviate: En bases de datos vectoriales y recuperación de información
- Universidad de Toronto: Como profesor, impartiendo sistemas de aprendizaje automático
- Posee una vasta experiencia en el ámbito académico, startups y la industria tecnológica
- Apasionado por el software de código abierto, la educación y la construcción de comunidades
Su estilo de enseñanza se asemeja más a aprender con un miembro experimentado del equipo que a una clase magistral tradicional.
Contenido principal del curso
Tres puntos clave de aprendizaje
Aplicaciones RAG del mundo real
- Aprender cómo la recuperación y la generación trabajan en conjunto
- Diseñar cada componente para construir un sistema RAG fiable y flexible
Técnicas de búsqueda y bases de datos vectoriales
- Búsqueda por palabras clave (Keyword Search)
- Búsqueda semántica (Semantic Search)
- Búsqueda híbrida (Hybrid Search)
- Técnicas de fragmentación (Chunking)
- Análisis de consultas (Query Parsing)
- Soporte para aplicaciones en múltiples dominios como la atención médica y el comercio electrónico
Diseño de prompts, evaluación e implementación
- Ingeniería de prompts que aprovecha al máximo el contexto recuperado
- Evaluación del rendimiento del sistema RAG
- Preparación de pipelines para entornos de producción
Esquema del curso (5 módulos)
Módulo 1: Introducción a RAG
Temas:
- Escenarios de aplicación de RAG
- Visión general de la arquitectura RAG
- Introducción a los fundamentos de LLM
- Introducción a Python
- Métodos de invocación de LLM
- Fundamentos de la recuperación de información
Proyectos prácticos:
- Escribir funciones de recuperación y mejora de prompts
- Construir el primer sistema RAG
- Pasar entradas estructuradas a un LLM
Módulo 2: Fundamentos de la recuperación de información y la búsqueda
Temas:
- Visión general de la arquitectura del recuperador
- Filtrado de metadatos (Metadata Filtering)
- Búsqueda por palabras clave (TF-IDF y BM25)
- Búsqueda semántica (Semantic Search)
- Incrustaciones vectoriales en RAG
- Búsqueda híbrida (Hybrid Search)
- Evaluación y métricas de recuperación
Proyectos prácticos:
- Implementar y comparar la búsqueda semántica, BM25 y Reciprocal Rank Fusion
- Observar el impacto de diferentes métodos de recuperación en las respuestas del LLM
Módulo 3: Recuperación de información con bases de datos vectoriales
Temas:
- Algoritmos ANN (Approximate Nearest Neighbor)
- Bases de datos vectoriales
- Introducción a la API de Weaviate
- Técnicas de fragmentación (Chunking)
- Análisis de consultas (Query Parsing)
- Cross-encoders y ColBERT
- Reordenamiento (Reranking)
Proyectos prácticos:
- Ampliar el sistema RAG utilizando Weaviate y un conjunto de datos de noticias reales
- Realizar fragmentación, indexación y recuperación de documentos
Módulo 4: Modelos de lenguaje grandes en RAG
Temas:
- Arquitectura Transformer
- Estrategias de muestreo de LLM
- Explorar las capacidades de los LLM
- Elegir el LLM adecuado
- Ingeniería de prompts (Prompt Engineering)
- Manejo del problema de las alucinaciones
- Evaluación del rendimiento de los LLM
- RAG Agéntico (Agentic RAG)
- RAG vs. Ajuste fino (Fine-tuning)
Proyectos prácticos:
- Desarrollar un chatbot específico de dominio para una tienda de ropa virtual
- Responder preguntas frecuentes y proporcionar sugerencias de productos basadas en un conjunto de datos personalizado
- Utilizar LLM de código abierto alojados en Together AI
Módulo 5: Producción, evaluación e implementación
Temas:
- Desafíos del entorno de producción
- Implementación de estrategias de evaluación de RAG
- Registro, monitoreo y observabilidad
- Seguimiento del sistema RAG
- Evaluación personalizada
- Técnicas de cuantificación (Quantization)
- Compromiso entre costo y calidad de respuesta
- Compromiso entre latencia y calidad de respuesta
- Seguridad
- RAG multimodal
Proyectos prácticos:
- Manejar desafíos del mundo real como la fijación dinámica de precios
- Registrar interacciones de usuario para monitoreo y depuración
- Mejorar la fiabilidad del chatbot
Pila tecnológica y herramientas
Herramientas principales
- Base de datos vectorial: Weaviate
- Plataforma LLM: Together AI (LLM de código abierto)
- Herramienta de monitoreo: Phoenix (Arize)
- Lenguaje de desarrollo: Python
Tecnologías involucradas
- Vector Embeddings
- Semantic Search
- BM25 Keyword Search
- Hybrid Search (TF-IDF + Semantic)
- Reciprocal Rank Fusion
- Cross-encoders
- ColBERT
- Chunking Strategies
- Query Parsing
- Reranking
- Prompt Engineering
- Quantization
Áreas de aplicación práctica
El curso utiliza conjuntos de datos reales de los siguientes dominios:
- 📰 Medios: Conjuntos de datos de noticias
- 🏥 Atención médica: Documentos médicos
- 🛍️ Comercio electrónico: Datos de productos, información de precios
- 📊 Finanzas: Documentos financieros
Resultados del aprendizaje
Al finalizar el curso, serás capaz de:
✅ Diseñar e implementar todas las partes de un sistema RAG completo
✅ Elegir la arquitectura correcta para tu caso de uso
✅ Utilizar bases de datos vectoriales como Weaviate
✅ Experimentar con estrategias de prompts y recuperación
✅ Monitorear el rendimiento con herramientas como Phoenix
✅ Comprender los compromisos clave:
- Cuándo usar la recuperación híbrida
- Cómo gestionar las limitaciones de la ventana de contexto
- Cómo equilibrar la latencia y el costo
✅ Evaluar e iterar para mejorar los pipelines RAG
✅ Adaptarse a nuevos métodos y a la evolución del ecosistema
✅ Pasar de la prueba de concepto a la implementación real
Requisitos previos
- Obligatorio: Habilidades intermedias en Python
- Recomendado: Conocimientos básicos de IA generativa
- Recomendado: Nivel de matemáticas de secundaria
Características del curso
🎯 Orientado a la práctica
- 5 experimentos de programación progresivos
- Desde prototipos simples hasta componentes de nivel de producción
- Conjuntos de datos del mundo real
📚 Aprendizaje sistemático
- Cubre técnicas a nivel de componente y de sistema
- Comprende los principios fundamentales y los compromisos prácticos
- Adáptate al ecosistema RAG en rápida evolución
🏆 Obtén una certificación
Al finalizar el curso, recibirás un certificado de DeepLearning.AI, que demuestra tus habilidades en la construcción y evaluación de sistemas RAG utilizando herramientas y tecnologías reales.
Importancia de RAG
¿Por qué se necesita RAG?
Aunque los grandes modelos de lenguaje son potentes, a menudo cometen errores si no tienen la información correcta. RAG resuelve este problema de las siguientes maneras:
- Respuestas fundamentadas: Basar las respuestas del modelo en datos relevantes, a menudo privados o actualizados
- Acceso a conocimiento externo: Recuperar información relevante no incluida en el entrenamiento del LLM
- Mejora de la precisión: Utilizar bases de conocimiento específicas del dominio, privadas o actualizadas
Escenarios de aplicación de RAG
- 🔧 Herramientas internas: Consulta de bases de conocimiento empresariales
- 💬 Asistentes de atención al cliente: Soporte basado en documentación de productos
- 🎯 Aplicaciones profesionales: Sistemas especializados en medicina, derecho, finanzas, etc.
- 📱 Asistentes personalizados: Servicios a medida basados en datos del usuario
Consejos de estudio
Según las recomendaciones de DeepLearning.AI:
- Crea un espacio de estudio dedicado: Establece un área de trabajo tranquila, ordenada y sin distracciones
- Establece un plan de estudio consistente: Fija horarios de estudio regulares para crear un hábito
- Toma descansos regulares: Utiliza la técnica Pomodoro (25 minutos de estudio + 5 minutos de descanso)
- Participa en la comunidad: Únete a foros, grupos de discusión y actividades comunitarias
- Aprende activamente: Toma notas, resume, enseña a otros o aplica lo aprendido en proyectos reales
Acceso al curso
- Sitio web oficial: https://www.deeplearning.ai/courses/retrieval-augmented-generation-rag/
- Plataforma Coursera: https://www.coursera.org/learn/retrieval-augmented-generation-rag
- Plataforma de aprendizaje: https://learn.deeplearning.ai/courses/retrieval-augmented-generation
Cursos relacionados recomendados
Si te interesa RAG, también puedes estudiar:
- Building and Evaluating Advanced RAG Applications
- Knowledge Graphs for RAG
- LangChain: Chat with Your Data
- Building Multimodal Search and RAG
- Building Agentic RAG with LlamaIndex
Resumen
Este es un curso RAG completo y profundo, ideal para quienes desean:
- Ingenieros que buscan pasar de la POC al entorno de producción
- Desarrolladores que construyen aplicaciones LLM fiables y escalables
- Profesionales de IA que desean comprender los compromisos de diseño de sistemas RAG
- Estudiantes que buscan dominar las últimas tecnologías y herramientas RAG
El curso no solo enseña la implementación técnica, sino que también se enfoca en desarrollar el pensamiento sistémico y las habilidades de toma de decisiones de ingeniería, ayudando a los estudiantes a mantenerse competitivos en el ecosistema RAG en constante evolución.