第五階段:AI應用場景探索
由 DeepLearning.AI 推出的 RAG 系統開發課程,學習使用向量資料庫和 LLM 建構生產級檢索增強生成應用,涵蓋從架構設計到部署評估的完整流程
檢索增強生成 (RAG) 課程詳細介紹
課程概覽
這是由 DeepLearning.AI 推出的一門全面的檢索增強生成(RAG)系統課程,旨在幫助學習者掌握從架構設計到部署評估的生產級 RAG 應用開發知識。
課程平台:DeepLearning.AI / Coursera
講師:Zain Hasan(Together AI 高級 AI/ML 工程師、多倫多大學講師)
課程時長:5小時影片 + 20+小時程式設計實踐
課程級別:中級
學習方式:自定進度學習
講師介紹
Zain Hasan 是一位擁有近十年經驗的 AI 工程師和教育者,曾任職於:
- Together AI:擔任 AI/ML 開發關係工程師
- Weaviate:從事向量資料庫和資訊檢索工作
- 多倫多大學:擔任講師,教授機器學習系統
- 在學術界、新創公司和科技產業都有豐富經驗
- 熱衷於開源軟體、教育和社群建設
他的教學風格更像是與一位經驗豐富的團隊成員學習,而不是傳統的課堂講座。
課程核心內容
三大學習重點
真實世界的 RAG 應用
- 學習檢索和生成如何協同運作
- 設計每個元件以建構可靠、靈活的 RAG 系統
搜尋技術與向量資料庫
- 關鍵字搜尋(Keyword Search)
- 語義搜尋(Semantic Search)
- 混合搜尋(Hybrid Search)
- 分塊技術(Chunking)
- 查詢解析(Query Parsing)
- 支援醫療保健和電子商務等多個領域的應用
提示設計、評估與部署
- 充分利用檢索上下文的提示工程
- 評估 RAG 系統效能
- 為生產環境準備管道
課程大綱(5個模組)
模組 1: RAG 簡介
主題:
- RAG 應用場景
- RAG 架構概覽
- LLM 基礎介紹
- Python 簡介
- LLM 呼叫方法
- 資訊檢索基礎
實踐專案:
- 編寫檢索和提示增強函數
- 建構第一個 RAG 系統
- 將結構化輸入傳遞給 LLM
模組 2: 資訊檢索與搜尋基礎
主題:
- 檢索器架構概覽
- 中繼資料過濾(Metadata Filtering)
- 關鍵字搜尋(TF-IDF 和 BM25)
- 語義搜尋(Semantic Search)
- RAG 中的向量嵌入
- 混合搜尋(Hybrid Search)
- 檢索評估與指標
實踐專案:
- 實作並比較語義搜尋、BM25 和 Reciprocal Rank Fusion
- 觀察不同檢索方法對 LLM 回應的影響
模組 3: 使用向量資料庫進行資訊檢索
主題:
- ANN(近似最近鄰)演算法
- 向量資料庫
- Weaviate API 介紹
- 分塊技術(Chunking)
- 查詢解析(Query Parsing)
- Cross-encoders 和 ColBERT
- 重排序(Reranking)
實踐專案:
- 使用 Weaviate 和真實新聞資料集擴展 RAG 系統
- 進行文件分塊、索引和檢索
模組 4: RAG 中的大型語言模型
主題:
- Transformer 架構
- LLM 取樣策略
- 探索 LLM 能力
- 選擇合適的 LLM
- 提示工程(Prompt Engineering)
- 處理幻覺問題
- 評估 LLM 效能
- Agentic RAG
- RAG vs. 微調(Fine-tuning)
實踐專案:
- 為虛擬服裝店開發領域特定聊天機器人
- 基於自訂資料集回答常見問題並提供產品建議
- 使用 Together AI 託管的開源 LLM
模組 5: 生產、評估與部署
主題:
- 生產環境的挑戰
- 實施 RAG 評估策略
- 日誌記錄、監控和可觀察性
- RAG 系統追蹤
- 自訂評估
- 量化技術(Quantization)
- 成本 vs 回應品質權衡
- 延遲 vs 回應品質權衡
- 安全性
- 多模態 RAG
實踐專案:
- 處理動態定價等現實挑戰
- 記錄使用者互動以進行監控和偵錯
- 提高聊天機器人可靠性
技術棧與工具
核心工具
- 向量資料庫:Weaviate
- LLM 平台:Together AI(開源 LLM)
- 監控工具:Phoenix (Arize)
- 開發語言:Python
涉及技術
- Vector Embeddings
- Semantic Search
- BM25 Keyword Search
- Hybrid Search (TF-IDF + Semantic)
- Reciprocal Rank Fusion
- Cross-encoders
- ColBERT
- Chunking Strategies
- Query Parsing
- Reranking
- Prompt Engineering
- Quantization
實際應用領域
課程使用來自以下領域的真實資料集:
- 📰 媒體:新聞資料集
- 🏥 醫療保健:醫療文件
- 🛍️ 電子商務:產品資料、定價資訊
- 📊 金融:財務文件
學習成果
完成課程後,你將能夠:
✅ 設計和實作完整的 RAG 系統各個部分
✅ 選擇適合用例的正確架構
✅ 使用 Weaviate 等向量資料庫
✅ 實驗提示和檢索策略
✅ 使用 Phoenix 等工具監控效能
✅ 理解關鍵權衡:
- 何時使用混合檢索
- 如何管理上下文視窗限制
- 如何平衡延遲和成本
✅ 評估和迭代改進 RAG 管道
✅ 適應新方法和生態系統演變
✅ 從概念驗證轉向實際部署
前置要求
- 必需:中級 Python 技能
- 推薦:生成式 AI 基礎知識
- 推薦:高中數學水平
課程特色
🎯 實踐導向
- 5個漸進式程式設計實驗
- 從簡單原型到生產級元件
- 真實世界資料集
📚 系統性學習
- 涵蓋元件級和系統級技術
- 理解基本原理和實際權衡
- 適應快速發展的 RAG 生態系統
🏆 獲得認證
完成課程後將獲得 DeepLearning.AI 頒發的證書,證明你在使用實際工具和技術建構和評估 RAG 系統方面的技能。
RAG 的重要性
為何需要 RAG?
大型語言模型雖然強大,但在沒有正確資訊的情況下經常會犯錯。RAG 透過以下方式解決這個問題:
- 接地回應:將模型回應建立在相關的、通常是私有或最新的資料上
- 存取外部知識:檢索 LLM 訓練時未包含的相關資訊
- 提高準確性:使用領域特定、私有或最新的知識庫
RAG 的應用場景
- 🔧 內部工具:企業知識庫查詢
- 💬 客戶服務助理:基於產品文件的支援
- 🎯 專業應用:醫療、法律、金融等領域的專業系統
- 📱 個人化助理:基於使用者資料的客製化服務
學習建議
根據 DeepLearning.AI 的建議:
- 建立專用學習空間:建立安靜、有序、無干擾的工作區
- 制定一致的學習計畫:設定固定學習時間,養成習慣
- 定期休息:使用番茄工作法(25分鐘學習 + 5分鐘休息)
- 參與社群:加入論壇、討論組和社群活動
- 主動學習:做筆記、總結、教授他人或在實際專案中應用
課程存取
- 官方網站:https://www.deeplearning.ai/courses/retrieval-augmented-generation-rag/
- Coursera 平台:https://www.coursera.org/learn/retrieval-augmented-generation-rag
- 學習平台:https://learn.deeplearning.ai/courses/retrieval-augmented-generation
相關課程推薦
如果你對 RAG 感興趣,還可以學習:
- Building and Evaluating Advanced RAG Applications
- Knowledge Graphs for RAG
- LangChain: Chat with Your Data
- Building Multimodal Search and RAG
- Building Agentic RAG with LlamaIndex
總結
這是一門全面、深入的 RAG 課程,適合希望:
- 從 POC 走向生產環境的工程師
- 建構可靠、可擴展的 LLM 應用的開發者
- 理解 RAG 系統設計權衡的 AI 從業者
- 掌握最新 RAG 技術和工具的學習者
課程不僅教授技術實作,更注重培養系統思維和工程決策能力,幫助學習者在 RAG 生態系統不斷演進的過程中保持競爭力。