Quinta Etapa: Exploração de Cenários de Aplicação de IA

Um curso de desenvolvimento de sistemas RAG da DeepLearning.AI, aprenda a usar bancos de dados vetoriais e LLMs para construir aplicativos de geração aumentada de recuperação de nível de produção, cobrindo todo o processo desde o design da arquitetura até a avaliação da implantação.

RAGBancoDeDadosVetorialAplicaçãoLLMWebSiteVideoFreeEnglish

Descrição Detalhada do Curso de Geração Aumentada por Recuperação (RAG)

Visão Geral do Curso

Este é um curso abrangente sobre sistemas de Geração Aumentada por Recuperação (RAG), oferecido pela DeepLearning.AI, projetado para ajudar os alunos a dominar o desenvolvimento de aplicações RAG de nível de produção, desde o design da arquitetura até a avaliação da implantação.

Plataforma do Curso: DeepLearning.AI / Coursera
Instrutor: Zain Hasan (Engenheiro Sênior de IA/ML na Together AI, Instrutor na Universidade de Toronto)
Duração do Curso: 5 horas de vídeo + 20+ horas de prática de programação
Nível do Curso: Intermediário
Formato de Estudo: Estudo em ritmo próprio

Apresentação do Instrutor

Zain Hasan é um engenheiro de IA e educador com quase uma década de experiência, tendo atuado em:

  • Together AI: Engenheiro de Relações de Desenvolvimento de IA/ML
  • Weaviate: Trabalhou com bancos de dados vetoriais e recuperação de informações
  • Universidade de Toronto: Instrutor, ensinando sistemas de Machine Learning
  • Possui vasta experiência na academia, startups e indústria de tecnologia
  • Apaixonado por software de código aberto, educação e construção de comunidades

Seu estilo de ensino assemelha-se mais a aprender com um membro experiente da equipe do que a uma aula tradicional.

Conteúdo Central do Curso

Três Principais Focos de Aprendizagem

  1. Aplicações RAG do Mundo Real

    • Aprender como a recuperação e a geração funcionam em conjunto
    • Projetar cada componente para construir sistemas RAG confiáveis e flexíveis
  2. Técnicas de Busca e Bancos de Dados Vetoriais

    • Busca por Palavras-chave (Keyword Search)
    • Busca Semântica (Semantic Search)
    • Busca Híbrida (Hybrid Search)
    • Técnicas de Fragmentação (Chunking)
    • Análise de Consulta (Query Parsing)
    • Suporte a aplicações em diversas áreas, como saúde e e-commerce
  3. Design de Prompts, Avaliação e Implantação

    • Engenharia de Prompts que aproveita ao máximo o contexto recuperado
    • Avaliar o desempenho de sistemas RAG
    • Preparar pipelines para ambientes de produção

Estrutura do Curso (5 Módulos)

Módulo 1: Introdução ao RAG

Tópicos:

  • Cenários de aplicação do RAG
  • Visão geral da arquitetura RAG
  • Introdução aos fundamentos de LLM
  • Introdução ao Python
  • Métodos de chamada de LLM
  • Fundamentos de recuperação de informações

Projetos Práticos:

  • Escrever funções de recuperação e aprimoramento de prompts
  • Construir o primeiro sistema RAG
  • Passar entradas estruturadas para LLMs

Módulo 2: Fundamentos de Recuperação de Informações e Busca

Tópicos:

  • Visão geral da arquitetura do recuperador
  • Filtragem de Metadados (Metadata Filtering)
  • Busca por Palavras-chave (TF-IDF e BM25)
  • Busca Semântica (Semantic Search)
  • Embeddings Vetoriais em RAG
  • Busca Híbrida (Hybrid Search)
  • Avaliação e Métricas de Recuperação

Projetos Práticos:

  • Implementar e comparar busca semântica, BM25 e Reciprocal Rank Fusion
  • Observar o impacto de diferentes métodos de recuperação nas respostas do LLM

Módulo 3: Recuperação de Informações com Bancos de Dados Vetoriais

Tópicos:

  • Algoritmos ANN (Approximate Nearest Neighbor)
  • Bancos de Dados Vetoriais
  • Introdução à API Weaviate
  • Técnicas de Fragmentação (Chunking)
  • Análise de Consulta (Query Parsing)
  • Cross-encoders e ColBERT
  • Reordenação (Reranking)

Projetos Práticos:

  • Estender sistemas RAG usando Weaviate e um conjunto de dados de notícias reais
  • Realizar fragmentação de documentos (chunking), indexação e recuperação

Módulo 4: Grandes Modelos de Linguagem em RAG

Tópicos:

  • Arquitetura Transformer
  • Estratégias de Amostragem de LLM
  • Explorar as capacidades dos LLMs
  • Escolher o LLM adequado
  • Engenharia de Prompts (Prompt Engineering)
  • Lidar com o problema da alucinação
  • Avaliar o desempenho do LLM
  • RAG Agente (Agentic RAG)
  • RAG vs. Fine-tuning

Projetos Práticos:

  • Desenvolver um chatbot específico para um domínio para uma loja de roupas virtual
  • Responder a perguntas frequentes e fornecer sugestões de produtos com base em um conjunto de dados personalizado
  • Usar LLMs de código aberto hospedados pela Together AI

Módulo 5: Produção, Avaliação e Implantação

Tópicos:

  • Desafios do ambiente de produção
  • Implementar estratégias de avaliação de RAG
  • Registro (Logging), Monitoramento e Observabilidade
  • Rastreamento de Sistemas RAG
  • Avaliação Personalizada
  • Técnicas de Quantização (Quantization)
  • Compromisso Custo vs. Qualidade da Resposta
  • Compromisso Latência vs. Qualidade da Resposta
  • Segurança
  • RAG Multimodal

Projetos Práticos:

  • Lidar com desafios do mundo real, como precificação dinâmica
  • Registrar interações do usuário para monitoramento e depuração
  • Melhorar a confiabilidade do chatbot

Pilha Tecnológica e Ferramentas

Ferramentas Principais

  • Banco de Dados Vetorial: Weaviate
  • Plataforma LLM: Together AI (LLMs de código aberto)
  • Ferramenta de Monitoramento: Phoenix (Arize)
  • Linguagem de Desenvolvimento: Python

Tecnologias Envolvidas

- Vector Embeddings
- Semantic Search
- BM25 Keyword Search
- Hybrid Search (TF-IDF + Semantic)
- Reciprocal Rank Fusion
- Cross-encoders
- ColBERT
- Chunking Strategies
- Query Parsing
- Reranking
- Prompt Engineering
- Quantization

Áreas de Aplicação Prática

O curso utiliza conjuntos de dados reais das seguintes áreas:

  • 📰 Mídia: Conjuntos de dados de notícias
  • 🏥 Saúde: Documentos médicos
  • 🛍️ E-commerce: Dados de produtos, informações de preços
  • 📊 Finanças: Documentos financeiros

Resultados da Aprendizagem

Ao concluir o curso, você será capaz de:

✅ Projetar e implementar todas as partes de um sistema RAG completo
✅ Escolher a arquitetura correta para o caso de uso
✅ Usar bancos de dados vetoriais como Weaviate
✅ Experimentar prompts e estratégias de recuperação
✅ Monitorar o desempenho usando ferramentas como Phoenix
✅ Compreender os principais compromissos:

  • Quando usar recuperação híbrida
  • Como gerenciar os limites da janela de contexto
  • Como equilibrar latência e custo

✅ Avaliar e melhorar iterativamente os pipelines RAG
✅ Adaptar-se a novas abordagens e à evolução do ecossistema
✅ Passar da prova de conceito para a implantação real

Pré-requisitos

  • Obrigatório: Habilidades intermediárias em Python
  • Recomendado: Conhecimentos básicos de IA Generativa
  • Recomendado: Nível de matemática do ensino médio

Diferenciais do Curso

🎯 Orientado à Prática

  • 5 experimentos de programação progressivos
  • Desde protótipos simples até componentes de nível de produção
  • Conjuntos de dados do mundo real

📚 Aprendizagem Sistemática

  • Abrange tecnologias de nível de componente e de sistema
  • Compreender os princípios fundamentais e os compromissos práticos
  • Adaptar-se ao ecossistema RAG em rápida evolução

🏆 Obtenção de Certificação

Ao concluir o curso, você receberá um certificado da DeepLearning.AI, comprovando suas habilidades na construção e avaliação de sistemas RAG usando ferramentas e tecnologias reais.

A Importância do RAG

Por que o RAG é necessário?

Embora os Grandes Modelos de Linguagem (LLMs) sejam poderosos, eles frequentemente cometem erros quando não possuem as informações corretas. O RAG resolve esse problema das seguintes maneiras:

  1. Respostas Fundamentadas: Basear as respostas do modelo em dados relevantes, frequentemente privados ou atualizados
  2. Acesso a Conhecimento Externo: Recuperar informações relevantes não incluídas no treinamento do LLM
  3. Aumento da Precisão: Usar bases de conhecimento específicas do domínio, privadas ou atualizadas

Cenários de Aplicação do RAG

  • 🔧 Ferramentas Internas: Consulta a bases de conhecimento corporativas
  • 💬 Assistentes de Atendimento ao Cliente: Suporte baseado em documentação de produtos
  • 🎯 Aplicações Profissionais: Sistemas especializados em áreas como medicina, direito, finanças
  • 📱 Assistentes Personalizados: Serviços personalizados baseados em dados do usuário

Conselhos de Estudo

De acordo com as recomendações da DeepLearning.AI:

  1. Criar um espaço de estudo dedicado: Estabelecer uma área de trabalho tranquila, organizada e livre de distrações
  2. Desenvolver um plano de estudo consistente: Definir horários fixos de estudo para criar um hábito
  3. Fazer pausas regulares: Usar a técnica Pomodoro (25 minutos de estudo + 5 minutos de descanso)
  4. Participar da comunidade: Juntar-se a fóruns, grupos de discussão e eventos da comunidade
  5. Aprender ativamente: Fazer anotações, resumir, ensinar a outros ou aplicar em projetos práticos

Acesso ao Curso

Cursos Relacionados Recomendados

Se você tem interesse em RAG, também pode aprender:

  • Building and Evaluating Advanced RAG Applications
  • Knowledge Graphs for RAG
  • LangChain: Chat with Your Data
  • Building Multimodal Search and RAG
  • Building Agentic RAG with LlamaIndex

Resumo

Este é um curso RAG abrangente e aprofundado, ideal para quem deseja:

  • Engenheiros que desejam passar de POC (Prova de Conceito) para ambientes de produção
  • Desenvolvedores que constroem aplicações LLM confiáveis e escaláveis
  • Profissionais de IA que compreendem os compromissos de design de sistemas RAG
  • Alunos que dominam as mais recentes tecnologias e ferramentas RAG

O curso não apenas ensina a implementação técnica, mas também foca no desenvolvimento do pensamento sistêmico e da capacidade de tomada de decisões de engenharia, ajudando os alunos a manterem-se competitivos no ecossistema RAG em constante evolução.