第五階段:AI應用場景探索

由 DeepLearning.AI 推出的 RAG 系統開發課程,學習使用向量資料庫和 LLM 建構生產級檢索增強生成應用,涵蓋從架構設計到部署評估的完整流程

RAGVectorDatabaseLLMApplicationWebSiteVideoFreeEnglish

檢索增強生成 (RAG) 課程詳細介紹

課程概覽

這是由 DeepLearning.AI 推出的一門全面的檢索增強生成(RAG)系統課程,旨在幫助學習者掌握從架構設計到部署評估的生產級 RAG 應用開發知識。

課程平台:DeepLearning.AI / Coursera
講師:Zain Hasan(Together AI 高級 AI/ML 工程師、多倫多大學講師)
課程時長:5小時影片 + 20+小時程式設計實踐
課程級別:中級
學習方式:自定進度學習

講師介紹

Zain Hasan 是一位擁有近十年經驗的 AI 工程師和教育者,曾任職於:

  • Together AI:擔任 AI/ML 開發關係工程師
  • Weaviate:從事向量資料庫和資訊檢索工作
  • 多倫多大學:擔任講師,教授機器學習系統
  • 在學術界、新創公司和科技產業都有豐富經驗
  • 熱衷於開源軟體、教育和社群建設

他的教學風格更像是與一位經驗豐富的團隊成員學習,而不是傳統的課堂講座。

課程核心內容

三大學習重點

  1. 真實世界的 RAG 應用

    • 學習檢索和生成如何協同運作
    • 設計每個元件以建構可靠、靈活的 RAG 系統
  2. 搜尋技術與向量資料庫

    • 關鍵字搜尋(Keyword Search)
    • 語義搜尋(Semantic Search)
    • 混合搜尋(Hybrid Search)
    • 分塊技術(Chunking)
    • 查詢解析(Query Parsing)
    • 支援醫療保健和電子商務等多個領域的應用
  3. 提示設計、評估與部署

    • 充分利用檢索上下文的提示工程
    • 評估 RAG 系統效能
    • 為生產環境準備管道

課程大綱(5個模組)

模組 1: RAG 簡介

主題

  • RAG 應用場景
  • RAG 架構概覽
  • LLM 基礎介紹
  • Python 簡介
  • LLM 呼叫方法
  • 資訊檢索基礎

實踐專案

  • 編寫檢索和提示增強函數
  • 建構第一個 RAG 系統
  • 將結構化輸入傳遞給 LLM

模組 2: 資訊檢索與搜尋基礎

主題

  • 檢索器架構概覽
  • 中繼資料過濾(Metadata Filtering)
  • 關鍵字搜尋(TF-IDF 和 BM25)
  • 語義搜尋(Semantic Search)
  • RAG 中的向量嵌入
  • 混合搜尋(Hybrid Search)
  • 檢索評估與指標

實踐專案

  • 實作並比較語義搜尋、BM25 和 Reciprocal Rank Fusion
  • 觀察不同檢索方法對 LLM 回應的影響

模組 3: 使用向量資料庫進行資訊檢索

主題

  • ANN(近似最近鄰)演算法
  • 向量資料庫
  • Weaviate API 介紹
  • 分塊技術(Chunking)
  • 查詢解析(Query Parsing)
  • Cross-encoders 和 ColBERT
  • 重排序(Reranking)

實踐專案

  • 使用 Weaviate 和真實新聞資料集擴展 RAG 系統
  • 進行文件分塊、索引和檢索

模組 4: RAG 中的大型語言模型

主題

  • Transformer 架構
  • LLM 取樣策略
  • 探索 LLM 能力
  • 選擇合適的 LLM
  • 提示工程(Prompt Engineering)
  • 處理幻覺問題
  • 評估 LLM 效能
  • Agentic RAG
  • RAG vs. 微調(Fine-tuning)

實踐專案

  • 為虛擬服裝店開發領域特定聊天機器人
  • 基於自訂資料集回答常見問題並提供產品建議
  • 使用 Together AI 託管的開源 LLM

模組 5: 生產、評估與部署

主題

  • 生產環境的挑戰
  • 實施 RAG 評估策略
  • 日誌記錄、監控和可觀察性
  • RAG 系統追蹤
  • 自訂評估
  • 量化技術(Quantization)
  • 成本 vs 回應品質權衡
  • 延遲 vs 回應品質權衡
  • 安全性
  • 多模態 RAG

實踐專案

  • 處理動態定價等現實挑戰
  • 記錄使用者互動以進行監控和偵錯
  • 提高聊天機器人可靠性

技術棧與工具

核心工具

  • 向量資料庫:Weaviate
  • LLM 平台:Together AI(開源 LLM)
  • 監控工具:Phoenix (Arize)
  • 開發語言:Python

涉及技術

- Vector Embeddings
- Semantic Search
- BM25 Keyword Search
- Hybrid Search (TF-IDF + Semantic)
- Reciprocal Rank Fusion
- Cross-encoders
- ColBERT
- Chunking Strategies
- Query Parsing
- Reranking
- Prompt Engineering
- Quantization

實際應用領域

課程使用來自以下領域的真實資料集:

  • 📰 媒體:新聞資料集
  • 🏥 醫療保健:醫療文件
  • 🛍️ 電子商務:產品資料、定價資訊
  • 📊 金融:財務文件

學習成果

完成課程後,你將能夠:

✅ 設計和實作完整的 RAG 系統各個部分
✅ 選擇適合用例的正確架構
✅ 使用 Weaviate 等向量資料庫
✅ 實驗提示和檢索策略
✅ 使用 Phoenix 等工具監控效能
✅ 理解關鍵權衡:

  • 何時使用混合檢索
  • 如何管理上下文視窗限制
  • 如何平衡延遲和成本

✅ 評估和迭代改進 RAG 管道
✅ 適應新方法和生態系統演變
✅ 從概念驗證轉向實際部署

前置要求

  • 必需:中級 Python 技能
  • 推薦:生成式 AI 基礎知識
  • 推薦:高中數學水平

課程特色

🎯 實踐導向

  • 5個漸進式程式設計實驗
  • 從簡單原型到生產級元件
  • 真實世界資料集

📚 系統性學習

  • 涵蓋元件級和系統級技術
  • 理解基本原理和實際權衡
  • 適應快速發展的 RAG 生態系統

🏆 獲得認證

完成課程後將獲得 DeepLearning.AI 頒發的證書,證明你在使用實際工具和技術建構和評估 RAG 系統方面的技能。

RAG 的重要性

為何需要 RAG?

大型語言模型雖然強大,但在沒有正確資訊的情況下經常會犯錯。RAG 透過以下方式解決這個問題:

  1. 接地回應:將模型回應建立在相關的、通常是私有或最新的資料上
  2. 存取外部知識:檢索 LLM 訓練時未包含的相關資訊
  3. 提高準確性:使用領域特定、私有或最新的知識庫

RAG 的應用場景

  • 🔧 內部工具:企業知識庫查詢
  • 💬 客戶服務助理:基於產品文件的支援
  • 🎯 專業應用:醫療、法律、金融等領域的專業系統
  • 📱 個人化助理:基於使用者資料的客製化服務

學習建議

根據 DeepLearning.AI 的建議:

  1. 建立專用學習空間:建立安靜、有序、無干擾的工作區
  2. 制定一致的學習計畫:設定固定學習時間,養成習慣
  3. 定期休息:使用番茄工作法(25分鐘學習 + 5分鐘休息)
  4. 參與社群:加入論壇、討論組和社群活動
  5. 主動學習:做筆記、總結、教授他人或在實際專案中應用

課程存取

相關課程推薦

如果你對 RAG 感興趣,還可以學習:

  • Building and Evaluating Advanced RAG Applications
  • Knowledge Graphs for RAG
  • LangChain: Chat with Your Data
  • Building Multimodal Search and RAG
  • Building Agentic RAG with LlamaIndex

總結

這是一門全面、深入的 RAG 課程,適合希望:

  • 從 POC 走向生產環境的工程師
  • 建構可靠、可擴展的 LLM 應用的開發者
  • 理解 RAG 系統設計權衡的 AI 從業者
  • 掌握最新 RAG 技術和工具的學習者

課程不僅教授技術實作,更注重培養系統思維和工程決策能力,幫助學習者在 RAG 生態系統不斷演進的過程中保持競爭力。