Cinquième étape : Exploration des scénarios d'application de l'IA

Un cours de développement de systèmes RAG proposé par DeepLearning.AI, apprenez à créer des applications de génération augmentée par récupération de niveau production à l'aide de bases de données vectorielles et de LLM, couvrant l'ensemble du processus, de la conception de l'architecture à l'évaluation du déploiement.

RAGVectorDatabaseLLMApplicationWebSiteVideoFreeEnglish

Présentation détaillée du cours sur la Génération Augmentée par Récupération (RAG)

Aperçu du cours

Il s'agit d'un cours complet sur les systèmes de Génération Augmentée par Récupération (RAG) proposé par DeepLearning.AI, conçu pour aider les apprenants à maîtriser le développement d'applications RAG de niveau production, de la conception architecturale à l'évaluation du déploiement.

Plateforme du cours : DeepLearning.AI / Coursera
Instructeur : Zain Hasan (Ingénieur Senior AI/ML chez Together AI, Conférencier à l'Université de Toronto)
Durée du cours : 5 heures de vidéo + 20+ heures de pratique de programmation
Niveau du cours : Intermédiaire
Mode d'apprentissage : Apprentissage à votre rythme

Présentation de l'instructeur

Zain Hasan est un ingénieur et éducateur en IA avec près de dix ans d'expérience, ayant travaillé chez :

  • Together AI : En tant qu'ingénieur en relations de développement AI/ML
  • Weaviate : Sur les bases de données vectorielles et la récupération d'informations
  • Université de Toronto : En tant que conférencier, enseignant les systèmes d'apprentissage automatique
  • Possède une riche expérience dans le monde universitaire, les startups et l'industrie technologique
  • Passionné par les logiciels open source, l'éducation et la construction de communautés

Son style d'enseignement s'apparente davantage à un apprentissage avec un membre d'équipe expérimenté qu'à un cours magistral traditionnel.

Contenu essentiel du cours

Trois points d'apprentissage clés

  1. Applications RAG du monde réel

    • Apprendre comment la récupération et la génération fonctionnent en synergie
    • Concevoir chaque composant pour construire un système RAG fiable et flexible
  2. Techniques de recherche et bases de données vectorielles

    • Recherche par mots-clés (Keyword Search)
    • Recherche sémantique (Semantic Search)
    • Recherche hybride (Hybrid Search)
    • Techniques de découpage (Chunking)
    • Analyse de requêtes (Query Parsing)
    • Prise en charge d'applications dans plusieurs domaines tels que la santé et le commerce électronique
  3. Conception de prompts, évaluation et déploiement

    • Ingénierie de prompts tirant pleinement parti du contexte de récupération
    • Évaluation des performances du système RAG
    • Préparation des pipelines pour l'environnement de production

Plan du cours (5 modules)

Module 1 : Introduction au RAG

Thèmes :

  • Scénarios d'application du RAG
  • Aperçu de l'architecture RAG
  • Introduction aux bases des LLM
  • Introduction à Python
  • Méthodes d'appel des LLM
  • Bases de la récupération d'informations

Projets pratiques :

  • Écrire des fonctions de récupération et d'amélioration des prompts
  • Construire le premier système RAG
  • Transmettre des entrées structurées aux LLM

Module 2 : Fondations de la récupération d'informations et de la recherche

Thèmes :

  • Aperçu de l'architecture du récupérateur
  • Filtrage des métadonnées (Metadata Filtering)
  • Recherche par mots-clés (TF-IDF et BM25)
  • Recherche sémantique (Semantic Search)
  • Embeddings vectoriels dans le RAG
  • Recherche hybride (Hybrid Search)
  • Évaluation et métriques de récupération

Projets pratiques :

  • Implémenter et comparer la recherche sémantique, BM25 et Reciprocal Rank Fusion
  • Observer l'impact des différentes méthodes de récupération sur les réponses des LLM

Module 3 : Récupération d'informations avec les bases de données vectorielles

Thèmes :

  • Algorithmes ANN (Approximate Nearest Neighbor)
  • Bases de données vectorielles
  • Introduction à l'API Weaviate
  • Techniques de découpage (Chunking)
  • Analyse de requêtes (Query Parsing)
  • Cross-encoders et ColBERT
  • Re-classement (Reranking)

Projets pratiques :

  • Étendre le système RAG en utilisant Weaviate et un ensemble de données de nouvelles réelles
  • Effectuer le découpage, l'indexation et la récupération de documents

Module 4 : Les grands modèles linguistiques (LLM) dans le RAG

Thèmes :

  • Architecture Transformer
  • Stratégies d'échantillonnage des LLM
  • Exploration des capacités des LLM
  • Choisir le LLM approprié
  • Ingénierie de prompts (Prompt Engineering)
  • Gérer le problème des hallucinations
  • Évaluer les performances des LLM
  • RAG agentique (Agentic RAG)
  • RAG vs. Fine-tuning (Réglage fin)

Projets pratiques :

  • Développer un chatbot spécifique à un domaine pour un magasin de vêtements virtuel
  • Répondre aux questions fréquentes et fournir des suggestions de produits basées sur un ensemble de données personnalisé
  • Utiliser des LLM open source hébergés par Together AI

Module 5 : Production, évaluation et déploiement

Thèmes :

  • Les défis de l'environnement de production
  • Implémenter des stratégies d'évaluation RAG
  • Journalisation, surveillance et observabilité
  • Traçage des systèmes RAG
  • Évaluation personnalisée
  • Techniques de quantification (Quantization)
  • Compromis coût vs. qualité de réponse
  • Compromis latence vs. qualité de réponse
  • Sécurité
  • RAG multimodal

Projets pratiques :

  • Gérer des défis réels tels que la tarification dynamique
  • Enregistrer les interactions utilisateur pour la surveillance et le débogage
  • Améliorer la fiabilité du chatbot

Pile technologique et outils

Outils essentiels

  • Base de données vectorielle : Weaviate
  • Plateforme LLM : Together AI (LLM open source)
  • Outil de surveillance : Phoenix (Arize)
  • Langage de développement : Python

Technologies impliquées

- Vector Embeddings
- Semantic Search
- BM25 Keyword Search
- Hybrid Search (TF-IDF + Semantic)
- Reciprocal Rank Fusion
- Cross-encoders
- ColBERT
- Chunking Strategies
- Query Parsing
- Reranking
- Prompt Engineering
- Quantization

Domaines d'application pratiques

Le cours utilise des ensembles de données réels provenant des domaines suivants :

  • 📰 Médias : Ensembles de données de nouvelles
  • 🏥 Santé : Documents médicaux
  • 🛍️ Commerce électronique : Données de produits, informations de prix
  • 📊 Finance : Documents financiers

Résultats d'apprentissage

Après avoir terminé le cours, vous serez capable de :

✅ Concevoir et implémenter toutes les parties d'un système RAG complet
✅ Choisir l'architecture appropriée pour votre cas d'utilisation
✅ Utiliser des bases de données vectorielles comme Weaviate
✅ Expérimenter des stratégies de prompts et de récupération
✅ Surveiller les performances avec des outils comme Phoenix
✅ Comprendre les compromis clés :

  • Quand utiliser la récupération hybride
  • Comment gérer les limites de la fenêtre contextuelle
  • Comment équilibrer la latence et le coût

✅ Évaluer et améliorer itérativement les pipelines RAG
✅ Vous adapter aux nouvelles méthodes et à l'évolution de l'écosystème
✅ Passer de la preuve de concept au déploiement réel

Prérequis

  • Obligatoire : Compétences intermédiaires en Python
  • Recommandé : Connaissances de base en IA générative
  • Recommandé : Niveau de mathématiques du lycée

Caractéristiques du cours

🎯 Orienté pratique

  • 5 expériences de programmation progressives
  • Du prototype simple aux composants de niveau production
  • Ensembles de données du monde réel

📚 Apprentissage systématique

  • Couvre les techniques au niveau des composants et du système
  • Comprend les principes fondamentaux et les compromis pratiques
  • S'adapte à l'écosystème RAG en évolution rapide

🏆 Obtenez une certification

Après avoir terminé le cours, vous recevrez un certificat de DeepLearning.AI, attestant de vos compétences dans la construction et l'évaluation de systèmes RAG à l'aide d'outils et de technologies réels.

L'importance du RAG

Pourquoi le RAG est-il nécessaire ?

Bien que puissants, les grands modèles linguistiques commettent souvent des erreurs en l'absence d'informations correctes. Le RAG résout ce problème en :

  1. Ancrant les réponses : Basant les réponses du modèle sur des données pertinentes, souvent privées ou à jour
  2. Accédant à des connaissances externes : Récupérant des informations pertinentes non incluses lors de l'entraînement du LLM
  3. Améliorant la précision : Utilisant une base de connaissances spécifique au domaine, privée ou à jour

Scénarios d'application du RAG

  • 🔧 Outils internes : Requêtes de bases de connaissances d'entreprise
  • 💬 Assistants de service client : Support basé sur la documentation produit
  • 🎯 Applications professionnelles : Systèmes spécialisés dans les domaines médical, juridique, financier, etc.
  • 📱 Assistants personnalisés : Services sur mesure basés sur les données utilisateur

Conseils d'apprentissage

Selon les recommandations de DeepLearning.AI :

  1. Créez un espace d'étude dédié : Établissez un espace de travail calme, ordonné et sans distractions
  2. Établissez un plan d'étude cohérent : Fixez des heures d'étude régulières et prenez l'habitude
  3. Faites des pauses régulières : Utilisez la technique Pomodoro (25 minutes d'étude + 5 minutes de pause)
  4. Participez à la communauté : Rejoignez des forums, des groupes de discussion et des activités communautaires
  5. Apprenez activement : Prenez des notes, résumez, enseignez aux autres ou appliquez dans des projets réels

Accès au cours

Cours connexes recommandés

Si le RAG vous intéresse, vous pouvez également suivre :

  • Building and Evaluating Advanced RAG Applications
  • Knowledge Graphs for RAG
  • LangChain: Chat with Your Data
  • Building Multimodal Search and RAG
  • Building Agentic RAG with LlamaIndex

Résumé

Il s'agit d'un cours RAG complet et approfondi, idéal pour ceux qui souhaitent :

  • Passer du POC à l'environnement de production en tant qu'ingénieurs
  • Construire des applications LLM fiables et évolutives en tant que développeurs
  • Comprendre les compromis de conception des systèmes RAG en tant que professionnels de l'IA
  • Maîtriser les dernières technologies et outils RAG en tant qu'apprenants

Le cours n'enseigne pas seulement la mise en œuvre technique, mais vise également à développer la pensée systémique et les capacités de prise de décision en ingénierie, aidant les apprenants à rester compétitifs dans l'écosystème RAG en constante évolution.