Cinquième étape : Exploration des scénarios d'application de l'IA
Un cours de développement de systèmes RAG proposé par DeepLearning.AI, apprenez à créer des applications de génération augmentée par récupération de niveau production à l'aide de bases de données vectorielles et de LLM, couvrant l'ensemble du processus, de la conception de l'architecture à l'évaluation du déploiement.
Présentation détaillée du cours sur la Génération Augmentée par Récupération (RAG)
Aperçu du cours
Il s'agit d'un cours complet sur les systèmes de Génération Augmentée par Récupération (RAG) proposé par DeepLearning.AI, conçu pour aider les apprenants à maîtriser le développement d'applications RAG de niveau production, de la conception architecturale à l'évaluation du déploiement.
Plateforme du cours : DeepLearning.AI / Coursera
Instructeur : Zain Hasan (Ingénieur Senior AI/ML chez Together AI, Conférencier à l'Université de Toronto)
Durée du cours : 5 heures de vidéo + 20+ heures de pratique de programmation
Niveau du cours : Intermédiaire
Mode d'apprentissage : Apprentissage à votre rythme
Présentation de l'instructeur
Zain Hasan est un ingénieur et éducateur en IA avec près de dix ans d'expérience, ayant travaillé chez :
- Together AI : En tant qu'ingénieur en relations de développement AI/ML
- Weaviate : Sur les bases de données vectorielles et la récupération d'informations
- Université de Toronto : En tant que conférencier, enseignant les systèmes d'apprentissage automatique
- Possède une riche expérience dans le monde universitaire, les startups et l'industrie technologique
- Passionné par les logiciels open source, l'éducation et la construction de communautés
Son style d'enseignement s'apparente davantage à un apprentissage avec un membre d'équipe expérimenté qu'à un cours magistral traditionnel.
Contenu essentiel du cours
Trois points d'apprentissage clés
Applications RAG du monde réel
- Apprendre comment la récupération et la génération fonctionnent en synergie
- Concevoir chaque composant pour construire un système RAG fiable et flexible
Techniques de recherche et bases de données vectorielles
- Recherche par mots-clés (Keyword Search)
- Recherche sémantique (Semantic Search)
- Recherche hybride (Hybrid Search)
- Techniques de découpage (Chunking)
- Analyse de requêtes (Query Parsing)
- Prise en charge d'applications dans plusieurs domaines tels que la santé et le commerce électronique
Conception de prompts, évaluation et déploiement
- Ingénierie de prompts tirant pleinement parti du contexte de récupération
- Évaluation des performances du système RAG
- Préparation des pipelines pour l'environnement de production
Plan du cours (5 modules)
Module 1 : Introduction au RAG
Thèmes :
- Scénarios d'application du RAG
- Aperçu de l'architecture RAG
- Introduction aux bases des LLM
- Introduction à Python
- Méthodes d'appel des LLM
- Bases de la récupération d'informations
Projets pratiques :
- Écrire des fonctions de récupération et d'amélioration des prompts
- Construire le premier système RAG
- Transmettre des entrées structurées aux LLM
Module 2 : Fondations de la récupération d'informations et de la recherche
Thèmes :
- Aperçu de l'architecture du récupérateur
- Filtrage des métadonnées (Metadata Filtering)
- Recherche par mots-clés (TF-IDF et BM25)
- Recherche sémantique (Semantic Search)
- Embeddings vectoriels dans le RAG
- Recherche hybride (Hybrid Search)
- Évaluation et métriques de récupération
Projets pratiques :
- Implémenter et comparer la recherche sémantique, BM25 et Reciprocal Rank Fusion
- Observer l'impact des différentes méthodes de récupération sur les réponses des LLM
Module 3 : Récupération d'informations avec les bases de données vectorielles
Thèmes :
- Algorithmes ANN (Approximate Nearest Neighbor)
- Bases de données vectorielles
- Introduction à l'API Weaviate
- Techniques de découpage (Chunking)
- Analyse de requêtes (Query Parsing)
- Cross-encoders et ColBERT
- Re-classement (Reranking)
Projets pratiques :
- Étendre le système RAG en utilisant Weaviate et un ensemble de données de nouvelles réelles
- Effectuer le découpage, l'indexation et la récupération de documents
Module 4 : Les grands modèles linguistiques (LLM) dans le RAG
Thèmes :
- Architecture Transformer
- Stratégies d'échantillonnage des LLM
- Exploration des capacités des LLM
- Choisir le LLM approprié
- Ingénierie de prompts (Prompt Engineering)
- Gérer le problème des hallucinations
- Évaluer les performances des LLM
- RAG agentique (Agentic RAG)
- RAG vs. Fine-tuning (Réglage fin)
Projets pratiques :
- Développer un chatbot spécifique à un domaine pour un magasin de vêtements virtuel
- Répondre aux questions fréquentes et fournir des suggestions de produits basées sur un ensemble de données personnalisé
- Utiliser des LLM open source hébergés par Together AI
Module 5 : Production, évaluation et déploiement
Thèmes :
- Les défis de l'environnement de production
- Implémenter des stratégies d'évaluation RAG
- Journalisation, surveillance et observabilité
- Traçage des systèmes RAG
- Évaluation personnalisée
- Techniques de quantification (Quantization)
- Compromis coût vs. qualité de réponse
- Compromis latence vs. qualité de réponse
- Sécurité
- RAG multimodal
Projets pratiques :
- Gérer des défis réels tels que la tarification dynamique
- Enregistrer les interactions utilisateur pour la surveillance et le débogage
- Améliorer la fiabilité du chatbot
Pile technologique et outils
Outils essentiels
- Base de données vectorielle : Weaviate
- Plateforme LLM : Together AI (LLM open source)
- Outil de surveillance : Phoenix (Arize)
- Langage de développement : Python
Technologies impliquées
- Vector Embeddings
- Semantic Search
- BM25 Keyword Search
- Hybrid Search (TF-IDF + Semantic)
- Reciprocal Rank Fusion
- Cross-encoders
- ColBERT
- Chunking Strategies
- Query Parsing
- Reranking
- Prompt Engineering
- Quantization
Domaines d'application pratiques
Le cours utilise des ensembles de données réels provenant des domaines suivants :
- 📰 Médias : Ensembles de données de nouvelles
- 🏥 Santé : Documents médicaux
- 🛍️ Commerce électronique : Données de produits, informations de prix
- 📊 Finance : Documents financiers
Résultats d'apprentissage
Après avoir terminé le cours, vous serez capable de :
✅ Concevoir et implémenter toutes les parties d'un système RAG complet
✅ Choisir l'architecture appropriée pour votre cas d'utilisation
✅ Utiliser des bases de données vectorielles comme Weaviate
✅ Expérimenter des stratégies de prompts et de récupération
✅ Surveiller les performances avec des outils comme Phoenix
✅ Comprendre les compromis clés :
- Quand utiliser la récupération hybride
- Comment gérer les limites de la fenêtre contextuelle
- Comment équilibrer la latence et le coût
✅ Évaluer et améliorer itérativement les pipelines RAG
✅ Vous adapter aux nouvelles méthodes et à l'évolution de l'écosystème
✅ Passer de la preuve de concept au déploiement réel
Prérequis
- Obligatoire : Compétences intermédiaires en Python
- Recommandé : Connaissances de base en IA générative
- Recommandé : Niveau de mathématiques du lycée
Caractéristiques du cours
🎯 Orienté pratique
- 5 expériences de programmation progressives
- Du prototype simple aux composants de niveau production
- Ensembles de données du monde réel
📚 Apprentissage systématique
- Couvre les techniques au niveau des composants et du système
- Comprend les principes fondamentaux et les compromis pratiques
- S'adapte à l'écosystème RAG en évolution rapide
🏆 Obtenez une certification
Après avoir terminé le cours, vous recevrez un certificat de DeepLearning.AI, attestant de vos compétences dans la construction et l'évaluation de systèmes RAG à l'aide d'outils et de technologies réels.
L'importance du RAG
Pourquoi le RAG est-il nécessaire ?
Bien que puissants, les grands modèles linguistiques commettent souvent des erreurs en l'absence d'informations correctes. Le RAG résout ce problème en :
- Ancrant les réponses : Basant les réponses du modèle sur des données pertinentes, souvent privées ou à jour
- Accédant à des connaissances externes : Récupérant des informations pertinentes non incluses lors de l'entraînement du LLM
- Améliorant la précision : Utilisant une base de connaissances spécifique au domaine, privée ou à jour
Scénarios d'application du RAG
- 🔧 Outils internes : Requêtes de bases de connaissances d'entreprise
- 💬 Assistants de service client : Support basé sur la documentation produit
- 🎯 Applications professionnelles : Systèmes spécialisés dans les domaines médical, juridique, financier, etc.
- 📱 Assistants personnalisés : Services sur mesure basés sur les données utilisateur
Conseils d'apprentissage
Selon les recommandations de DeepLearning.AI :
- Créez un espace d'étude dédié : Établissez un espace de travail calme, ordonné et sans distractions
- Établissez un plan d'étude cohérent : Fixez des heures d'étude régulières et prenez l'habitude
- Faites des pauses régulières : Utilisez la technique Pomodoro (25 minutes d'étude + 5 minutes de pause)
- Participez à la communauté : Rejoignez des forums, des groupes de discussion et des activités communautaires
- Apprenez activement : Prenez des notes, résumez, enseignez aux autres ou appliquez dans des projets réels
Accès au cours
- Site officiel : https://www.deeplearning.ai/courses/retrieval-augmented-generation-rag/
- Plateforme Coursera : https://www.coursera.org/learn/retrieval-augmented-generation-rag
- Plateforme d'apprentissage : https://learn.deeplearning.ai/courses/retrieval-augmented-generation
Cours connexes recommandés
Si le RAG vous intéresse, vous pouvez également suivre :
- Building and Evaluating Advanced RAG Applications
- Knowledge Graphs for RAG
- LangChain: Chat with Your Data
- Building Multimodal Search and RAG
- Building Agentic RAG with LlamaIndex
Résumé
Il s'agit d'un cours RAG complet et approfondi, idéal pour ceux qui souhaitent :
- Passer du POC à l'environnement de production en tant qu'ingénieurs
- Construire des applications LLM fiables et évolutives en tant que développeurs
- Comprendre les compromis de conception des systèmes RAG en tant que professionnels de l'IA
- Maîtriser les dernières technologies et outils RAG en tant qu'apprenants
Le cours n'enseigne pas seulement la mise en œuvre technique, mais vise également à développer la pensée systémique et les capacités de prise de décision en ingénierie, aidant les apprenants à rester compétitifs dans l'écosystème RAG en constante évolution.