Quinta Etapa: Exploração de Cenários de Aplicação de IA
Um curso de desenvolvimento de sistemas RAG da DeepLearning.AI, aprenda a usar bancos de dados vetoriais e LLMs para construir aplicativos de geração aumentada de recuperação de nível de produção, cobrindo todo o processo desde o design da arquitetura até a avaliação da implantação.
Descrição Detalhada do Curso de Geração Aumentada por Recuperação (RAG)
Visão Geral do Curso
Este é um curso abrangente sobre sistemas de Geração Aumentada por Recuperação (RAG), oferecido pela DeepLearning.AI, projetado para ajudar os alunos a dominar o desenvolvimento de aplicações RAG de nível de produção, desde o design da arquitetura até a avaliação da implantação.
Plataforma do Curso: DeepLearning.AI / Coursera
Instrutor: Zain Hasan (Engenheiro Sênior de IA/ML na Together AI, Instrutor na Universidade de Toronto)
Duração do Curso: 5 horas de vídeo + 20+ horas de prática de programação
Nível do Curso: Intermediário
Formato de Estudo: Estudo em ritmo próprio
Apresentação do Instrutor
Zain Hasan é um engenheiro de IA e educador com quase uma década de experiência, tendo atuado em:
- Together AI: Engenheiro de Relações de Desenvolvimento de IA/ML
- Weaviate: Trabalhou com bancos de dados vetoriais e recuperação de informações
- Universidade de Toronto: Instrutor, ensinando sistemas de Machine Learning
- Possui vasta experiência na academia, startups e indústria de tecnologia
- Apaixonado por software de código aberto, educação e construção de comunidades
Seu estilo de ensino assemelha-se mais a aprender com um membro experiente da equipe do que a uma aula tradicional.
Conteúdo Central do Curso
Três Principais Focos de Aprendizagem
Aplicações RAG do Mundo Real
- Aprender como a recuperação e a geração funcionam em conjunto
- Projetar cada componente para construir sistemas RAG confiáveis e flexíveis
Técnicas de Busca e Bancos de Dados Vetoriais
- Busca por Palavras-chave (Keyword Search)
- Busca Semântica (Semantic Search)
- Busca Híbrida (Hybrid Search)
- Técnicas de Fragmentação (Chunking)
- Análise de Consulta (Query Parsing)
- Suporte a aplicações em diversas áreas, como saúde e e-commerce
Design de Prompts, Avaliação e Implantação
- Engenharia de Prompts que aproveita ao máximo o contexto recuperado
- Avaliar o desempenho de sistemas RAG
- Preparar pipelines para ambientes de produção
Estrutura do Curso (5 Módulos)
Módulo 1: Introdução ao RAG
Tópicos:
- Cenários de aplicação do RAG
- Visão geral da arquitetura RAG
- Introdução aos fundamentos de LLM
- Introdução ao Python
- Métodos de chamada de LLM
- Fundamentos de recuperação de informações
Projetos Práticos:
- Escrever funções de recuperação e aprimoramento de prompts
- Construir o primeiro sistema RAG
- Passar entradas estruturadas para LLMs
Módulo 2: Fundamentos de Recuperação de Informações e Busca
Tópicos:
- Visão geral da arquitetura do recuperador
- Filtragem de Metadados (Metadata Filtering)
- Busca por Palavras-chave (TF-IDF e BM25)
- Busca Semântica (Semantic Search)
- Embeddings Vetoriais em RAG
- Busca Híbrida (Hybrid Search)
- Avaliação e Métricas de Recuperação
Projetos Práticos:
- Implementar e comparar busca semântica, BM25 e Reciprocal Rank Fusion
- Observar o impacto de diferentes métodos de recuperação nas respostas do LLM
Módulo 3: Recuperação de Informações com Bancos de Dados Vetoriais
Tópicos:
- Algoritmos ANN (Approximate Nearest Neighbor)
- Bancos de Dados Vetoriais
- Introdução à API Weaviate
- Técnicas de Fragmentação (Chunking)
- Análise de Consulta (Query Parsing)
- Cross-encoders e ColBERT
- Reordenação (Reranking)
Projetos Práticos:
- Estender sistemas RAG usando Weaviate e um conjunto de dados de notícias reais
- Realizar fragmentação de documentos (chunking), indexação e recuperação
Módulo 4: Grandes Modelos de Linguagem em RAG
Tópicos:
- Arquitetura Transformer
- Estratégias de Amostragem de LLM
- Explorar as capacidades dos LLMs
- Escolher o LLM adequado
- Engenharia de Prompts (Prompt Engineering)
- Lidar com o problema da alucinação
- Avaliar o desempenho do LLM
- RAG Agente (Agentic RAG)
- RAG vs. Fine-tuning
Projetos Práticos:
- Desenvolver um chatbot específico para um domínio para uma loja de roupas virtual
- Responder a perguntas frequentes e fornecer sugestões de produtos com base em um conjunto de dados personalizado
- Usar LLMs de código aberto hospedados pela Together AI
Módulo 5: Produção, Avaliação e Implantação
Tópicos:
- Desafios do ambiente de produção
- Implementar estratégias de avaliação de RAG
- Registro (Logging), Monitoramento e Observabilidade
- Rastreamento de Sistemas RAG
- Avaliação Personalizada
- Técnicas de Quantização (Quantization)
- Compromisso Custo vs. Qualidade da Resposta
- Compromisso Latência vs. Qualidade da Resposta
- Segurança
- RAG Multimodal
Projetos Práticos:
- Lidar com desafios do mundo real, como precificação dinâmica
- Registrar interações do usuário para monitoramento e depuração
- Melhorar a confiabilidade do chatbot
Pilha Tecnológica e Ferramentas
Ferramentas Principais
- Banco de Dados Vetorial: Weaviate
- Plataforma LLM: Together AI (LLMs de código aberto)
- Ferramenta de Monitoramento: Phoenix (Arize)
- Linguagem de Desenvolvimento: Python
Tecnologias Envolvidas
- Vector Embeddings
- Semantic Search
- BM25 Keyword Search
- Hybrid Search (TF-IDF + Semantic)
- Reciprocal Rank Fusion
- Cross-encoders
- ColBERT
- Chunking Strategies
- Query Parsing
- Reranking
- Prompt Engineering
- Quantization
Áreas de Aplicação Prática
O curso utiliza conjuntos de dados reais das seguintes áreas:
- 📰 Mídia: Conjuntos de dados de notícias
- 🏥 Saúde: Documentos médicos
- 🛍️ E-commerce: Dados de produtos, informações de preços
- 📊 Finanças: Documentos financeiros
Resultados da Aprendizagem
Ao concluir o curso, você será capaz de:
✅ Projetar e implementar todas as partes de um sistema RAG completo
✅ Escolher a arquitetura correta para o caso de uso
✅ Usar bancos de dados vetoriais como Weaviate
✅ Experimentar prompts e estratégias de recuperação
✅ Monitorar o desempenho usando ferramentas como Phoenix
✅ Compreender os principais compromissos:
- Quando usar recuperação híbrida
- Como gerenciar os limites da janela de contexto
- Como equilibrar latência e custo
✅ Avaliar e melhorar iterativamente os pipelines RAG
✅ Adaptar-se a novas abordagens e à evolução do ecossistema
✅ Passar da prova de conceito para a implantação real
Pré-requisitos
- Obrigatório: Habilidades intermediárias em Python
- Recomendado: Conhecimentos básicos de IA Generativa
- Recomendado: Nível de matemática do ensino médio
Diferenciais do Curso
🎯 Orientado à Prática
- 5 experimentos de programação progressivos
- Desde protótipos simples até componentes de nível de produção
- Conjuntos de dados do mundo real
📚 Aprendizagem Sistemática
- Abrange tecnologias de nível de componente e de sistema
- Compreender os princípios fundamentais e os compromissos práticos
- Adaptar-se ao ecossistema RAG em rápida evolução
🏆 Obtenção de Certificação
Ao concluir o curso, você receberá um certificado da DeepLearning.AI, comprovando suas habilidades na construção e avaliação de sistemas RAG usando ferramentas e tecnologias reais.
A Importância do RAG
Por que o RAG é necessário?
Embora os Grandes Modelos de Linguagem (LLMs) sejam poderosos, eles frequentemente cometem erros quando não possuem as informações corretas. O RAG resolve esse problema das seguintes maneiras:
- Respostas Fundamentadas: Basear as respostas do modelo em dados relevantes, frequentemente privados ou atualizados
- Acesso a Conhecimento Externo: Recuperar informações relevantes não incluídas no treinamento do LLM
- Aumento da Precisão: Usar bases de conhecimento específicas do domínio, privadas ou atualizadas
Cenários de Aplicação do RAG
- 🔧 Ferramentas Internas: Consulta a bases de conhecimento corporativas
- 💬 Assistentes de Atendimento ao Cliente: Suporte baseado em documentação de produtos
- 🎯 Aplicações Profissionais: Sistemas especializados em áreas como medicina, direito, finanças
- 📱 Assistentes Personalizados: Serviços personalizados baseados em dados do usuário
Conselhos de Estudo
De acordo com as recomendações da DeepLearning.AI:
- Criar um espaço de estudo dedicado: Estabelecer uma área de trabalho tranquila, organizada e livre de distrações
- Desenvolver um plano de estudo consistente: Definir horários fixos de estudo para criar um hábito
- Fazer pausas regulares: Usar a técnica Pomodoro (25 minutos de estudo + 5 minutos de descanso)
- Participar da comunidade: Juntar-se a fóruns, grupos de discussão e eventos da comunidade
- Aprender ativamente: Fazer anotações, resumir, ensinar a outros ou aplicar em projetos práticos
Acesso ao Curso
- Site Oficial: https://www.deeplearning.ai/courses/retrieval-augmented-generation-rag/
- Plataforma Coursera: https://www.coursera.org/learn/retrieval-augmented-generation-rag
- Plataforma de Aprendizagem: https://learn.deeplearning.ai/courses/retrieval-augmented-generation
Cursos Relacionados Recomendados
Se você tem interesse em RAG, também pode aprender:
- Building and Evaluating Advanced RAG Applications
- Knowledge Graphs for RAG
- LangChain: Chat with Your Data
- Building Multimodal Search and RAG
- Building Agentic RAG with LlamaIndex
Resumo
Este é um curso RAG abrangente e aprofundado, ideal para quem deseja:
- Engenheiros que desejam passar de POC (Prova de Conceito) para ambientes de produção
- Desenvolvedores que constroem aplicações LLM confiáveis e escaláveis
- Profissionais de IA que compreendem os compromissos de design de sistemas RAG
- Alunos que dominam as mais recentes tecnologias e ferramentas RAG
O curso não apenas ensina a implementação técnica, mas também foca no desenvolvimento do pensamento sistêmico e da capacidade de tomada de decisões de engenharia, ajudando os alunos a manterem-se competitivos no ecossistema RAG em constante evolução.