Quinta etapa: Exploración de escenarios de aplicación de la IA

Curso de desarrollo de sistemas RAG de DeepLearning.AI, aprende a construir aplicaciones de generación aumentada de recuperación de nivel de producción utilizando bases de datos vectoriales y LLM, cubriendo el proceso completo desde el diseño de la arquitectura hasta la evaluación de la implementación.

RAGBaseDeDatosVectorialAplicaciónLLMWebSiteVideoFreeEnglish

Introducción detallada al curso de Generación Aumentada por Recuperación (RAG)

Resumen del curso

Este es un curso integral sobre sistemas de Generación Aumentada por Recuperación (RAG) ofrecido por DeepLearning.AI, diseñado para ayudar a los estudiantes a dominar el desarrollo de aplicaciones RAG de nivel de producción, desde el diseño de la arquitectura hasta la evaluación de la implementación.

Plataforma del curso: DeepLearning.AI / Coursera
Instructor: Zain Hasan (Ingeniero Senior de AI/ML en Together AI, Profesor en la Universidad de Toronto)
Duración del curso: 5 horas de vídeo + más de 20 horas de práctica de programación
Nivel del curso: Intermedio
Modalidad de estudio: A tu propio ritmo

Presentación del instructor

Zain Hasan es un ingeniero de IA y educador con casi una década de experiencia, habiendo trabajado en:

Together AI: Como Ingeniero de Relaciones de Desarrollo de AI/ML
Weaviate: En bases de datos vectoriales y recuperación de información
Universidad de Toronto: Como profesor, impartiendo sistemas de aprendizaje automático
Posee una vasta experiencia en el ámbito académico, startups y la industria tecnológica
Apasionado por el software de código abierto, la educación y la construcción de comunidades

Su estilo de enseñanza se asemeja más a aprender con un miembro experimentado del equipo que a una clase magistral tradicional.

Contenido principal del curso

Tres puntos clave de aprendizaje

Aplicaciones RAG del mundo real
- Aprender cómo la recuperación y la generación trabajan en conjunto
- Diseñar cada componente para construir un sistema RAG fiable y flexible
Técnicas de búsqueda y bases de datos vectoriales
- Búsqueda por palabras clave (Keyword Search)
- Búsqueda semántica (Semantic Search)
- Búsqueda híbrida (Hybrid Search)
- Técnicas de fragmentación (Chunking)
- Análisis de consultas (Query Parsing)
- Soporte para aplicaciones en múltiples dominios como la atención médica y el comercio electrónico
Diseño de prompts, evaluación e implementación
- Ingeniería de prompts que aprovecha al máximo el contexto recuperado
- Evaluación del rendimiento del sistema RAG
- Preparación de pipelines para entornos de producción

Esquema del curso (5 módulos)

Módulo 1: Introducción a RAG

Temas:

Escenarios de aplicación de RAG
Visión general de la arquitectura RAG
Introducción a los fundamentos de LLM
Introducción a Python
Métodos de invocación de LLM
Fundamentos de la recuperación de información

Proyectos prácticos:

Escribir funciones de recuperación y mejora de prompts
Construir el primer sistema RAG
Pasar entradas estructuradas a un LLM

Módulo 2: Fundamentos de la recuperación de información y la búsqueda

Temas:

Visión general de la arquitectura del recuperador
Filtrado de metadatos (Metadata Filtering)
Búsqueda por palabras clave (TF-IDF y BM25)
Búsqueda semántica (Semantic Search)
Incrustaciones vectoriales en RAG
Búsqueda híbrida (Hybrid Search)
Evaluación y métricas de recuperación

Proyectos prácticos:

Implementar y comparar la búsqueda semántica, BM25 y Reciprocal Rank Fusion
Observar el impacto de diferentes métodos de recuperación en las respuestas del LLM

Módulo 3: Recuperación de información con bases de datos vectoriales

Temas:

Algoritmos ANN (Approximate Nearest Neighbor)
Bases de datos vectoriales
Introducción a la API de Weaviate
Técnicas de fragmentación (Chunking)
Análisis de consultas (Query Parsing)
Cross-encoders y ColBERT
Reordenamiento (Reranking)

Proyectos prácticos:

Ampliar el sistema RAG utilizando Weaviate y un conjunto de datos de noticias reales
Realizar fragmentación, indexación y recuperación de documentos

Módulo 4: Modelos de lenguaje grandes en RAG

Temas:

Arquitectura Transformer
Estrategias de muestreo de LLM
Explorar las capacidades de los LLM
Elegir el LLM adecuado
Ingeniería de prompts (Prompt Engineering)
Manejo del problema de las alucinaciones
Evaluación del rendimiento de los LLM
RAG Agéntico (Agentic RAG)
RAG vs. Ajuste fino (Fine-tuning)

Proyectos prácticos:

Desarrollar un chatbot específico de dominio para una tienda de ropa virtual
Responder preguntas frecuentes y proporcionar sugerencias de productos basadas en un conjunto de datos personalizado
Utilizar LLM de código abierto alojados en Together AI

Módulo 5: Producción, evaluación e implementación

Temas:

Desafíos del entorno de producción
Implementación de estrategias de evaluación de RAG
Registro, monitoreo y observabilidad
Seguimiento del sistema RAG
Evaluación personalizada
Técnicas de cuantificación (Quantization)
Compromiso entre costo y calidad de respuesta
Compromiso entre latencia y calidad de respuesta
Seguridad
RAG multimodal

Proyectos prácticos:

Manejar desafíos del mundo real como la fijación dinámica de precios
Registrar interacciones de usuario para monitoreo y depuración
Mejorar la fiabilidad del chatbot

Pila tecnológica y herramientas

Herramientas principales

Base de datos vectorial: Weaviate
Plataforma LLM: Together AI (LLM de código abierto)
Herramienta de monitoreo: Phoenix (Arize)
Lenguaje de desarrollo: Python

Tecnologías involucradas

- Vector Embeddings
- Semantic Search
- BM25 Keyword Search
- Hybrid Search (TF-IDF + Semantic)
- Reciprocal Rank Fusion
- Cross-encoders
- ColBERT
- Chunking Strategies
- Query Parsing
- Reranking
- Prompt Engineering
- Quantization

Áreas de aplicación práctica

El curso utiliza conjuntos de datos reales de los siguientes dominios:

📰 Medios: Conjuntos de datos de noticias
🏥 Atención médica: Documentos médicos
🛍️ Comercio electrónico: Datos de productos, información de precios
📊 Finanzas: Documentos financieros

Resultados del aprendizaje

Al finalizar el curso, serás capaz de:

✅ Diseñar e implementar todas las partes de un sistema RAG completo
✅ Elegir la arquitectura correcta para tu caso de uso
✅ Utilizar bases de datos vectoriales como Weaviate
✅ Experimentar con estrategias de prompts y recuperación
✅ Monitorear el rendimiento con herramientas como Phoenix
✅ Comprender los compromisos clave:

Cuándo usar la recuperación híbrida
Cómo gestionar las limitaciones de la ventana de contexto
Cómo equilibrar la latencia y el costo

✅ Evaluar e iterar para mejorar los pipelines RAG
✅ Adaptarse a nuevos métodos y a la evolución del ecosistema
✅ Pasar de la prueba de concepto a la implementación real

Requisitos previos

Obligatorio: Habilidades intermedias en Python
Recomendado: Conocimientos básicos de IA generativa
Recomendado: Nivel de matemáticas de secundaria

Características del curso

🎯 Orientado a la práctica

5 experimentos de programación progresivos
Desde prototipos simples hasta componentes de nivel de producción
Conjuntos de datos del mundo real

📚 Aprendizaje sistemático

Cubre técnicas a nivel de componente y de sistema
Comprende los principios fundamentales y los compromisos prácticos
Adáptate al ecosistema RAG en rápida evolución

🏆 Obtén una certificación

Al finalizar el curso, recibirás un certificado de DeepLearning.AI, que demuestra tus habilidades en la construcción y evaluación de sistemas RAG utilizando herramientas y tecnologías reales.

Importancia de RAG

¿Por qué se necesita RAG?

Aunque los grandes modelos de lenguaje son potentes, a menudo cometen errores si no tienen la información correcta. RAG resuelve este problema de las siguientes maneras:

Respuestas fundamentadas: Basar las respuestas del modelo en datos relevantes, a menudo privados o actualizados
Acceso a conocimiento externo: Recuperar información relevante no incluida en el entrenamiento del LLM
Mejora de la precisión: Utilizar bases de conocimiento específicas del dominio, privadas o actualizadas

Escenarios de aplicación de RAG

🔧 Herramientas internas: Consulta de bases de conocimiento empresariales
💬 Asistentes de atención al cliente: Soporte basado en documentación de productos
🎯 Aplicaciones profesionales: Sistemas especializados en medicina, derecho, finanzas, etc.
📱 Asistentes personalizados: Servicios a medida basados en datos del usuario

Consejos de estudio

Según las recomendaciones de DeepLearning.AI:

Crea un espacio de estudio dedicado: Establece un área de trabajo tranquila, ordenada y sin distracciones
Establece un plan de estudio consistente: Fija horarios de estudio regulares para crear un hábito
Toma descansos regulares: Utiliza la técnica Pomodoro (25 minutos de estudio + 5 minutos de descanso)
Participa en la comunidad: Únete a foros, grupos de discusión y actividades comunitarias
Aprende activamente: Toma notas, resume, enseña a otros o aplica lo aprendido en proyectos reales

Acceso al curso

Sitio web oficial: https://www.deeplearning.ai/courses/retrieval-augmented-generation-rag/
Plataforma Coursera: https://www.coursera.org/learn/retrieval-augmented-generation-rag
Plataforma de aprendizaje: https://learn.deeplearning.ai/courses/retrieval-augmented-generation

Cursos relacionados recomendados

Si te interesa RAG, también puedes estudiar:

Building and Evaluating Advanced RAG Applications
Knowledge Graphs for RAG
LangChain: Chat with Your Data
Building Multimodal Search and RAG
Building Agentic RAG with LlamaIndex

Resumen

Este es un curso RAG completo y profundo, ideal para quienes desean:

Ingenieros que buscan pasar de la POC al entorno de producción
Desarrolladores que construyen aplicaciones LLM fiables y escalables
Profesionales de IA que desean comprender los compromisos de diseño de sistemas RAG
Estudiantes que buscan dominar las últimas tecnologías y herramientas RAG

El curso no solo enseña la implementación técnica, sino que también se enfoca en desarrollar el pensamiento sistémico y las habilidades de toma de decisiones de ingeniería, ayudando a los estudiantes a mantenerse competitivos en el ecosistema RAG en constante evolución.