Quinta Etapa: Exploração de Cenários de Aplicação de IA

Um curso de desenvolvimento de sistemas RAG da DeepLearning.AI, aprenda a usar bancos de dados vetoriais e LLMs para construir aplicativos de geração aumentada de recuperação de nível de produção, cobrindo todo o processo desde o design da arquitetura até a avaliação da implantação.

RAGBancoDeDadosVetorialAplicaçãoLLMWebSiteVideoFreeEnglish

Descrição Detalhada do Curso de Geração Aumentada por Recuperação (RAG)

Visão Geral do Curso

Este é um curso abrangente sobre sistemas de Geração Aumentada por Recuperação (RAG), oferecido pela DeepLearning.AI, projetado para ajudar os alunos a dominar o desenvolvimento de aplicações RAG de nível de produção, desde o design da arquitetura até a avaliação da implantação.

Plataforma do Curso: DeepLearning.AI / Coursera
Instrutor: Zain Hasan (Engenheiro Sênior de IA/ML na Together AI, Instrutor na Universidade de Toronto)
Duração do Curso: 5 horas de vídeo + 20+ horas de prática de programação
Nível do Curso: Intermediário
Formato de Estudo: Estudo em ritmo próprio

Apresentação do Instrutor

Zain Hasan é um engenheiro de IA e educador com quase uma década de experiência, tendo atuado em:

Together AI: Engenheiro de Relações de Desenvolvimento de IA/ML
Weaviate: Trabalhou com bancos de dados vetoriais e recuperação de informações
Universidade de Toronto: Instrutor, ensinando sistemas de Machine Learning
Possui vasta experiência na academia, startups e indústria de tecnologia
Apaixonado por software de código aberto, educação e construção de comunidades

Seu estilo de ensino assemelha-se mais a aprender com um membro experiente da equipe do que a uma aula tradicional.

Conteúdo Central do Curso

Três Principais Focos de Aprendizagem

Aplicações RAG do Mundo Real
- Aprender como a recuperação e a geração funcionam em conjunto
- Projetar cada componente para construir sistemas RAG confiáveis e flexíveis
Técnicas de Busca e Bancos de Dados Vetoriais
- Busca por Palavras-chave (Keyword Search)
- Busca Semântica (Semantic Search)
- Busca Híbrida (Hybrid Search)
- Técnicas de Fragmentação (Chunking)
- Análise de Consulta (Query Parsing)
- Suporte a aplicações em diversas áreas, como saúde e e-commerce
Design de Prompts, Avaliação e Implantação
- Engenharia de Prompts que aproveita ao máximo o contexto recuperado
- Avaliar o desempenho de sistemas RAG
- Preparar pipelines para ambientes de produção

Estrutura do Curso (5 Módulos)

Módulo 1: Introdução ao RAG

Tópicos:

Cenários de aplicação do RAG
Visão geral da arquitetura RAG
Introdução aos fundamentos de LLM
Introdução ao Python
Métodos de chamada de LLM
Fundamentos de recuperação de informações

Projetos Práticos:

Escrever funções de recuperação e aprimoramento de prompts
Construir o primeiro sistema RAG
Passar entradas estruturadas para LLMs

Módulo 2: Fundamentos de Recuperação de Informações e Busca

Tópicos:

Visão geral da arquitetura do recuperador
Filtragem de Metadados (Metadata Filtering)
Busca por Palavras-chave (TF-IDF e BM25)
Busca Semântica (Semantic Search)
Embeddings Vetoriais em RAG
Busca Híbrida (Hybrid Search)
Avaliação e Métricas de Recuperação

Projetos Práticos:

Implementar e comparar busca semântica, BM25 e Reciprocal Rank Fusion
Observar o impacto de diferentes métodos de recuperação nas respostas do LLM

Módulo 3: Recuperação de Informações com Bancos de Dados Vetoriais

Tópicos:

Algoritmos ANN (Approximate Nearest Neighbor)
Bancos de Dados Vetoriais
Introdução à API Weaviate
Técnicas de Fragmentação (Chunking)
Análise de Consulta (Query Parsing)
Cross-encoders e ColBERT
Reordenação (Reranking)

Projetos Práticos:

Estender sistemas RAG usando Weaviate e um conjunto de dados de notícias reais
Realizar fragmentação de documentos (chunking), indexação e recuperação

Módulo 4: Grandes Modelos de Linguagem em RAG

Tópicos:

Arquitetura Transformer
Estratégias de Amostragem de LLM
Explorar as capacidades dos LLMs
Escolher o LLM adequado
Engenharia de Prompts (Prompt Engineering)
Lidar com o problema da alucinação
Avaliar o desempenho do LLM
RAG Agente (Agentic RAG)
RAG vs. Fine-tuning

Projetos Práticos:

Desenvolver um chatbot específico para um domínio para uma loja de roupas virtual
Responder a perguntas frequentes e fornecer sugestões de produtos com base em um conjunto de dados personalizado
Usar LLMs de código aberto hospedados pela Together AI

Módulo 5: Produção, Avaliação e Implantação

Tópicos:

Desafios do ambiente de produção
Implementar estratégias de avaliação de RAG
Registro (Logging), Monitoramento e Observabilidade
Rastreamento de Sistemas RAG
Avaliação Personalizada
Técnicas de Quantização (Quantization)
Compromisso Custo vs. Qualidade da Resposta
Compromisso Latência vs. Qualidade da Resposta
Segurança
RAG Multimodal

Projetos Práticos:

Lidar com desafios do mundo real, como precificação dinâmica
Registrar interações do usuário para monitoramento e depuração
Melhorar a confiabilidade do chatbot

Pilha Tecnológica e Ferramentas

Ferramentas Principais

Banco de Dados Vetorial: Weaviate
Plataforma LLM: Together AI (LLMs de código aberto)
Ferramenta de Monitoramento: Phoenix (Arize)
Linguagem de Desenvolvimento: Python

Tecnologias Envolvidas

- Vector Embeddings
- Semantic Search
- BM25 Keyword Search
- Hybrid Search (TF-IDF + Semantic)
- Reciprocal Rank Fusion
- Cross-encoders
- ColBERT
- Chunking Strategies
- Query Parsing
- Reranking
- Prompt Engineering
- Quantization

Áreas de Aplicação Prática

O curso utiliza conjuntos de dados reais das seguintes áreas:

📰 Mídia: Conjuntos de dados de notícias
🏥 Saúde: Documentos médicos
🛍️ E-commerce: Dados de produtos, informações de preços
📊 Finanças: Documentos financeiros

Resultados da Aprendizagem

Ao concluir o curso, você será capaz de:

✅ Projetar e implementar todas as partes de um sistema RAG completo
✅ Escolher a arquitetura correta para o caso de uso
✅ Usar bancos de dados vetoriais como Weaviate
✅ Experimentar prompts e estratégias de recuperação
✅ Monitorar o desempenho usando ferramentas como Phoenix
✅ Compreender os principais compromissos:

Quando usar recuperação híbrida
Como gerenciar os limites da janela de contexto
Como equilibrar latência e custo

✅ Avaliar e melhorar iterativamente os pipelines RAG
✅ Adaptar-se a novas abordagens e à evolução do ecossistema
✅ Passar da prova de conceito para a implantação real

Pré-requisitos

Obrigatório: Habilidades intermediárias em Python
Recomendado: Conhecimentos básicos de IA Generativa
Recomendado: Nível de matemática do ensino médio

Diferenciais do Curso

🎯 Orientado à Prática

5 experimentos de programação progressivos
Desde protótipos simples até componentes de nível de produção
Conjuntos de dados do mundo real

📚 Aprendizagem Sistemática

Abrange tecnologias de nível de componente e de sistema
Compreender os princípios fundamentais e os compromissos práticos
Adaptar-se ao ecossistema RAG em rápida evolução

🏆 Obtenção de Certificação

Ao concluir o curso, você receberá um certificado da DeepLearning.AI, comprovando suas habilidades na construção e avaliação de sistemas RAG usando ferramentas e tecnologias reais.

A Importância do RAG

Por que o RAG é necessário?

Embora os Grandes Modelos de Linguagem (LLMs) sejam poderosos, eles frequentemente cometem erros quando não possuem as informações corretas. O RAG resolve esse problema das seguintes maneiras:

Respostas Fundamentadas: Basear as respostas do modelo em dados relevantes, frequentemente privados ou atualizados
Acesso a Conhecimento Externo: Recuperar informações relevantes não incluídas no treinamento do LLM
Aumento da Precisão: Usar bases de conhecimento específicas do domínio, privadas ou atualizadas

Cenários de Aplicação do RAG

🔧 Ferramentas Internas: Consulta a bases de conhecimento corporativas
💬 Assistentes de Atendimento ao Cliente: Suporte baseado em documentação de produtos
🎯 Aplicações Profissionais: Sistemas especializados em áreas como medicina, direito, finanças
📱 Assistentes Personalizados: Serviços personalizados baseados em dados do usuário

Conselhos de Estudo

De acordo com as recomendações da DeepLearning.AI:

Criar um espaço de estudo dedicado: Estabelecer uma área de trabalho tranquila, organizada e livre de distrações
Desenvolver um plano de estudo consistente: Definir horários fixos de estudo para criar um hábito
Fazer pausas regulares: Usar a técnica Pomodoro (25 minutos de estudo + 5 minutos de descanso)
Participar da comunidade: Juntar-se a fóruns, grupos de discussão e eventos da comunidade
Aprender ativamente: Fazer anotações, resumir, ensinar a outros ou aplicar em projetos práticos

Acesso ao Curso

Site Oficial: https://www.deeplearning.ai/courses/retrieval-augmented-generation-rag/
Plataforma Coursera: https://www.coursera.org/learn/retrieval-augmented-generation-rag
Plataforma de Aprendizagem: https://learn.deeplearning.ai/courses/retrieval-augmented-generation

Cursos Relacionados Recomendados

Se você tem interesse em RAG, também pode aprender:

Building and Evaluating Advanced RAG Applications
Knowledge Graphs for RAG
LangChain: Chat with Your Data
Building Multimodal Search and RAG
Building Agentic RAG with LlamaIndex

Resumo

Este é um curso RAG abrangente e aprofundado, ideal para quem deseja:

Engenheiros que desejam passar de POC (Prova de Conceito) para ambientes de produção
Desenvolvedores que constroem aplicações LLM confiáveis e escaláveis
Profissionais de IA que compreendem os compromissos de design de sistemas RAG
Alunos que dominam as mais recentes tecnologias e ferramentas RAG

O curso não apenas ensina a implementação técnica, mas também foca no desenvolvimento do pensamento sistêmico e da capacidade de tomada de decisões de engenharia, ajudando os alunos a manterem-se competitivos no ecossistema RAG em constante evolução.