Cinquième étape : Exploration des scénarios d'application de l'IA

Un cours de développement de systèmes RAG proposé par DeepLearning.AI, apprenez à créer des applications de génération augmentée par récupération de niveau production à l'aide de bases de données vectorielles et de LLM, couvrant l'ensemble du processus, de la conception de l'architecture à l'évaluation du déploiement.

RAGVectorDatabaseLLMApplicationWebSiteVideoFreeEnglish

Présentation détaillée du cours sur la Génération Augmentée par Récupération (RAG)

Aperçu du cours

Il s'agit d'un cours complet sur les systèmes de Génération Augmentée par Récupération (RAG) proposé par DeepLearning.AI, conçu pour aider les apprenants à maîtriser le développement d'applications RAG de niveau production, de la conception architecturale à l'évaluation du déploiement.

Plateforme du cours : DeepLearning.AI / Coursera
Instructeur : Zain Hasan (Ingénieur Senior AI/ML chez Together AI, Conférencier à l'Université de Toronto)
Durée du cours : 5 heures de vidéo + 20+ heures de pratique de programmation
Niveau du cours : Intermédiaire
Mode d'apprentissage : Apprentissage à votre rythme

Présentation de l'instructeur

Zain Hasan est un ingénieur et éducateur en IA avec près de dix ans d'expérience, ayant travaillé chez :

Together AI : En tant qu'ingénieur en relations de développement AI/ML
Weaviate : Sur les bases de données vectorielles et la récupération d'informations
Université de Toronto : En tant que conférencier, enseignant les systèmes d'apprentissage automatique
Possède une riche expérience dans le monde universitaire, les startups et l'industrie technologique
Passionné par les logiciels open source, l'éducation et la construction de communautés

Son style d'enseignement s'apparente davantage à un apprentissage avec un membre d'équipe expérimenté qu'à un cours magistral traditionnel.

Contenu essentiel du cours

Trois points d'apprentissage clés

Applications RAG du monde réel
- Apprendre comment la récupération et la génération fonctionnent en synergie
- Concevoir chaque composant pour construire un système RAG fiable et flexible
Techniques de recherche et bases de données vectorielles
- Recherche par mots-clés (Keyword Search)
- Recherche sémantique (Semantic Search)
- Recherche hybride (Hybrid Search)
- Techniques de découpage (Chunking)
- Analyse de requêtes (Query Parsing)
- Prise en charge d'applications dans plusieurs domaines tels que la santé et le commerce électronique
Conception de prompts, évaluation et déploiement
- Ingénierie de prompts tirant pleinement parti du contexte de récupération
- Évaluation des performances du système RAG
- Préparation des pipelines pour l'environnement de production

Plan du cours (5 modules)

Module 1 : Introduction au RAG

Thèmes :

Scénarios d'application du RAG
Aperçu de l'architecture RAG
Introduction aux bases des LLM
Introduction à Python
Méthodes d'appel des LLM
Bases de la récupération d'informations

Projets pratiques :

Écrire des fonctions de récupération et d'amélioration des prompts
Construire le premier système RAG
Transmettre des entrées structurées aux LLM

Module 2 : Fondations de la récupération d'informations et de la recherche

Thèmes :

Aperçu de l'architecture du récupérateur
Filtrage des métadonnées (Metadata Filtering)
Recherche par mots-clés (TF-IDF et BM25)
Recherche sémantique (Semantic Search)
Embeddings vectoriels dans le RAG
Recherche hybride (Hybrid Search)
Évaluation et métriques de récupération

Projets pratiques :

Implémenter et comparer la recherche sémantique, BM25 et Reciprocal Rank Fusion
Observer l'impact des différentes méthodes de récupération sur les réponses des LLM

Module 3 : Récupération d'informations avec les bases de données vectorielles

Thèmes :

Algorithmes ANN (Approximate Nearest Neighbor)
Bases de données vectorielles
Introduction à l'API Weaviate
Techniques de découpage (Chunking)
Analyse de requêtes (Query Parsing)
Cross-encoders et ColBERT
Re-classement (Reranking)

Projets pratiques :

Étendre le système RAG en utilisant Weaviate et un ensemble de données de nouvelles réelles
Effectuer le découpage, l'indexation et la récupération de documents

Module 4 : Les grands modèles linguistiques (LLM) dans le RAG

Thèmes :

Architecture Transformer
Stratégies d'échantillonnage des LLM
Exploration des capacités des LLM
Choisir le LLM approprié
Ingénierie de prompts (Prompt Engineering)
Gérer le problème des hallucinations
Évaluer les performances des LLM
RAG agentique (Agentic RAG)
RAG vs. Fine-tuning (Réglage fin)

Projets pratiques :

Développer un chatbot spécifique à un domaine pour un magasin de vêtements virtuel
Répondre aux questions fréquentes et fournir des suggestions de produits basées sur un ensemble de données personnalisé
Utiliser des LLM open source hébergés par Together AI

Module 5 : Production, évaluation et déploiement

Thèmes :

Les défis de l'environnement de production
Implémenter des stratégies d'évaluation RAG
Journalisation, surveillance et observabilité
Traçage des systèmes RAG
Évaluation personnalisée
Techniques de quantification (Quantization)
Compromis coût vs. qualité de réponse
Compromis latence vs. qualité de réponse
Sécurité
RAG multimodal

Projets pratiques :

Gérer des défis réels tels que la tarification dynamique
Enregistrer les interactions utilisateur pour la surveillance et le débogage
Améliorer la fiabilité du chatbot

Pile technologique et outils

Outils essentiels

Base de données vectorielle : Weaviate
Plateforme LLM : Together AI (LLM open source)
Outil de surveillance : Phoenix (Arize)
Langage de développement : Python

Technologies impliquées

- Vector Embeddings
- Semantic Search
- BM25 Keyword Search
- Hybrid Search (TF-IDF + Semantic)
- Reciprocal Rank Fusion
- Cross-encoders
- ColBERT
- Chunking Strategies
- Query Parsing
- Reranking
- Prompt Engineering
- Quantization

Domaines d'application pratiques

Le cours utilise des ensembles de données réels provenant des domaines suivants :

📰 Médias : Ensembles de données de nouvelles
🏥 Santé : Documents médicaux
🛍️ Commerce électronique : Données de produits, informations de prix
📊 Finance : Documents financiers

Résultats d'apprentissage

Après avoir terminé le cours, vous serez capable de :

✅ Concevoir et implémenter toutes les parties d'un système RAG complet
✅ Choisir l'architecture appropriée pour votre cas d'utilisation
✅ Utiliser des bases de données vectorielles comme Weaviate
✅ Expérimenter des stratégies de prompts et de récupération
✅ Surveiller les performances avec des outils comme Phoenix
✅ Comprendre les compromis clés :

Quand utiliser la récupération hybride
Comment gérer les limites de la fenêtre contextuelle
Comment équilibrer la latence et le coût

✅ Évaluer et améliorer itérativement les pipelines RAG
✅ Vous adapter aux nouvelles méthodes et à l'évolution de l'écosystème
✅ Passer de la preuve de concept au déploiement réel

Prérequis

Obligatoire : Compétences intermédiaires en Python
Recommandé : Connaissances de base en IA générative
Recommandé : Niveau de mathématiques du lycée

Caractéristiques du cours

🎯 Orienté pratique

5 expériences de programmation progressives
Du prototype simple aux composants de niveau production
Ensembles de données du monde réel

📚 Apprentissage systématique

Couvre les techniques au niveau des composants et du système
Comprend les principes fondamentaux et les compromis pratiques
S'adapte à l'écosystème RAG en évolution rapide

🏆 Obtenez une certification

Après avoir terminé le cours, vous recevrez un certificat de DeepLearning.AI, attestant de vos compétences dans la construction et l'évaluation de systèmes RAG à l'aide d'outils et de technologies réels.

L'importance du RAG

Pourquoi le RAG est-il nécessaire ?

Bien que puissants, les grands modèles linguistiques commettent souvent des erreurs en l'absence d'informations correctes. Le RAG résout ce problème en :

Ancrant les réponses : Basant les réponses du modèle sur des données pertinentes, souvent privées ou à jour
Accédant à des connaissances externes : Récupérant des informations pertinentes non incluses lors de l'entraînement du LLM
Améliorant la précision : Utilisant une base de connaissances spécifique au domaine, privée ou à jour

Scénarios d'application du RAG

🔧 Outils internes : Requêtes de bases de connaissances d'entreprise
💬 Assistants de service client : Support basé sur la documentation produit
🎯 Applications professionnelles : Systèmes spécialisés dans les domaines médical, juridique, financier, etc.
📱 Assistants personnalisés : Services sur mesure basés sur les données utilisateur

Conseils d'apprentissage

Selon les recommandations de DeepLearning.AI :

Créez un espace d'étude dédié : Établissez un espace de travail calme, ordonné et sans distractions
Établissez un plan d'étude cohérent : Fixez des heures d'étude régulières et prenez l'habitude
Faites des pauses régulières : Utilisez la technique Pomodoro (25 minutes d'étude + 5 minutes de pause)
Participez à la communauté : Rejoignez des forums, des groupes de discussion et des activités communautaires
Apprenez activement : Prenez des notes, résumez, enseignez aux autres ou appliquez dans des projets réels

Accès au cours

Site officiel : https://www.deeplearning.ai/courses/retrieval-augmented-generation-rag/
Plateforme Coursera : https://www.coursera.org/learn/retrieval-augmented-generation-rag
Plateforme d'apprentissage : https://learn.deeplearning.ai/courses/retrieval-augmented-generation

Cours connexes recommandés

Si le RAG vous intéresse, vous pouvez également suivre :

Building and Evaluating Advanced RAG Applications
Knowledge Graphs for RAG
LangChain: Chat with Your Data
Building Multimodal Search and RAG
Building Agentic RAG with LlamaIndex

Résumé

Il s'agit d'un cours RAG complet et approfondi, idéal pour ceux qui souhaitent :

Passer du POC à l'environnement de production en tant qu'ingénieurs
Construire des applications LLM fiables et évolutives en tant que développeurs
Comprendre les compromis de conception des systèmes RAG en tant que professionnels de l'IA
Maîtriser les dernières technologies et outils RAG en tant qu'apprenants

Le cours n'enseigne pas seulement la mise en œuvre technique, mais vise également à développer la pensée systémique et les capacités de prise de décision en ingénierie, aidant les apprenants à rester compétitifs dans l'écosystème RAG en constante évolution.