第五階段：AI應用場景探索

由 DeepLearning.AI 推出的 RAG 系統開發課程，學習使用向量資料庫和 LLM 建構生產級檢索增強生成應用，涵蓋從架構設計到部署評估的完整流程

RAGVectorDatabaseLLMApplicationWebSiteVideoFreeEnglish

檢索增強生成 (RAG) 課程詳細介紹

課程概覽

這是由 DeepLearning.AI 推出的一門全面的檢索增強生成（RAG）系統課程，旨在幫助學習者掌握從架構設計到部署評估的生產級 RAG 應用開發知識。

課程平台：DeepLearning.AI / Coursera
講師：Zain Hasan（Together AI 高級 AI/ML 工程師、多倫多大學講師）
課程時長：5小時影片 + 20+小時程式設計實踐
課程級別：中級
學習方式：自定進度學習

講師介紹

Zain Hasan 是一位擁有近十年經驗的 AI 工程師和教育者，曾任職於：

Together AI：擔任 AI/ML 開發關係工程師
Weaviate：從事向量資料庫和資訊檢索工作
多倫多大學：擔任講師，教授機器學習系統
在學術界、新創公司和科技產業都有豐富經驗
熱衷於開源軟體、教育和社群建設

他的教學風格更像是與一位經驗豐富的團隊成員學習，而不是傳統的課堂講座。

課程核心內容

三大學習重點

真實世界的 RAG 應用
- 學習檢索和生成如何協同運作
- 設計每個元件以建構可靠、靈活的 RAG 系統
搜尋技術與向量資料庫
- 關鍵字搜尋（Keyword Search）
- 語義搜尋（Semantic Search）
- 混合搜尋（Hybrid Search）
- 分塊技術（Chunking）
- 查詢解析（Query Parsing）
- 支援醫療保健和電子商務等多個領域的應用
提示設計、評估與部署
- 充分利用檢索上下文的提示工程
- 評估 RAG 系統效能
- 為生產環境準備管道

課程大綱（5個模組）

模組 1: RAG 簡介

主題：

RAG 應用場景
RAG 架構概覽
LLM 基礎介紹
Python 簡介
LLM 呼叫方法
資訊檢索基礎

實踐專案：

編寫檢索和提示增強函數
建構第一個 RAG 系統
將結構化輸入傳遞給 LLM

模組 2: 資訊檢索與搜尋基礎

主題：

檢索器架構概覽
中繼資料過濾（Metadata Filtering）
關鍵字搜尋（TF-IDF 和 BM25）
語義搜尋（Semantic Search）
RAG 中的向量嵌入
混合搜尋（Hybrid Search）
檢索評估與指標

實踐專案：

實作並比較語義搜尋、BM25 和 Reciprocal Rank Fusion
觀察不同檢索方法對 LLM 回應的影響

模組 3: 使用向量資料庫進行資訊檢索

主題：

ANN（近似最近鄰）演算法
向量資料庫
Weaviate API 介紹
分塊技術（Chunking）
查詢解析（Query Parsing）
Cross-encoders 和 ColBERT
重排序（Reranking）

實踐專案：

使用 Weaviate 和真實新聞資料集擴展 RAG 系統
進行文件分塊、索引和檢索

模組 4: RAG 中的大型語言模型

主題：

Transformer 架構
LLM 取樣策略
探索 LLM 能力
選擇合適的 LLM
提示工程（Prompt Engineering）
處理幻覺問題
評估 LLM 效能
Agentic RAG
RAG vs. 微調（Fine-tuning）

實踐專案：

為虛擬服裝店開發領域特定聊天機器人
基於自訂資料集回答常見問題並提供產品建議
使用 Together AI 託管的開源 LLM

模組 5: 生產、評估與部署

主題：

生產環境的挑戰
實施 RAG 評估策略
日誌記錄、監控和可觀察性
RAG 系統追蹤
自訂評估
量化技術（Quantization）
成本 vs 回應品質權衡
延遲 vs 回應品質權衡
安全性
多模態 RAG

實踐專案：

處理動態定價等現實挑戰
記錄使用者互動以進行監控和偵錯
提高聊天機器人可靠性

技術棧與工具

核心工具

向量資料庫：Weaviate
LLM 平台：Together AI（開源 LLM）
監控工具：Phoenix (Arize)
開發語言：Python

涉及技術

- Vector Embeddings
- Semantic Search
- BM25 Keyword Search
- Hybrid Search (TF-IDF + Semantic)
- Reciprocal Rank Fusion
- Cross-encoders
- ColBERT
- Chunking Strategies
- Query Parsing
- Reranking
- Prompt Engineering
- Quantization

實際應用領域

課程使用來自以下領域的真實資料集：

📰 媒體：新聞資料集
🏥 醫療保健：醫療文件
🛍️ 電子商務：產品資料、定價資訊
📊 金融：財務文件

學習成果

完成課程後，你將能夠：

✅ 設計和實作完整的 RAG 系統各個部分
✅ 選擇適合用例的正確架構
✅ 使用 Weaviate 等向量資料庫
✅ 實驗提示和檢索策略
✅ 使用 Phoenix 等工具監控效能
✅ 理解關鍵權衡：

何時使用混合檢索
如何管理上下文視窗限制
如何平衡延遲和成本

✅ 評估和迭代改進 RAG 管道
✅ 適應新方法和生態系統演變
✅ 從概念驗證轉向實際部署

前置要求

必需：中級 Python 技能
推薦：生成式 AI 基礎知識
推薦：高中數學水平

課程特色

🎯 實踐導向

5個漸進式程式設計實驗
從簡單原型到生產級元件
真實世界資料集

📚 系統性學習

涵蓋元件級和系統級技術
理解基本原理和實際權衡
適應快速發展的 RAG 生態系統

🏆 獲得認證

完成課程後將獲得 DeepLearning.AI 頒發的證書，證明你在使用實際工具和技術建構和評估 RAG 系統方面的技能。

RAG 的重要性

為何需要 RAG？

大型語言模型雖然強大，但在沒有正確資訊的情況下經常會犯錯。RAG 透過以下方式解決這個問題：

接地回應：將模型回應建立在相關的、通常是私有或最新的資料上
存取外部知識：檢索 LLM 訓練時未包含的相關資訊
提高準確性：使用領域特定、私有或最新的知識庫

RAG 的應用場景

🔧 內部工具：企業知識庫查詢
💬 客戶服務助理：基於產品文件的支援
🎯 專業應用：醫療、法律、金融等領域的專業系統
📱 個人化助理：基於使用者資料的客製化服務

學習建議

根據 DeepLearning.AI 的建議：

建立專用學習空間：建立安靜、有序、無干擾的工作區
制定一致的學習計畫：設定固定學習時間，養成習慣
定期休息：使用番茄工作法（25分鐘學習 + 5分鐘休息）
參與社群：加入論壇、討論組和社群活動
主動學習：做筆記、總結、教授他人或在實際專案中應用

課程存取

官方網站：https://www.deeplearning.ai/courses/retrieval-augmented-generation-rag/
Coursera 平台：https://www.coursera.org/learn/retrieval-augmented-generation-rag
學習平台：https://learn.deeplearning.ai/courses/retrieval-augmented-generation

總結

這是一門全面、深入的 RAG 課程，適合希望：

從 POC 走向生產環境的工程師
建構可靠、可擴展的 LLM 應用的開發者
理解 RAG 系統設計權衡的 AI 從業者
掌握最新 RAG 技術和工具的學習者

課程不僅教授技術實作，更注重培養系統思維和工程決策能力，幫助學習者在 RAG 生態系統不斷演進的過程中保持競爭力。

第五階段：AI應用場景探索

由 DeepLearning.AI 推出的 RAG 系統開發課程，學習使用向量資料庫和 LLM 建構生產級檢索增強生成應用，涵蓋從架構設計到部署評估的完整流程

檢索增強生成 (RAG) 課程詳細介紹

課程概覽

講師介紹

課程核心內容

三大學習重點

課程大綱（5個模組）

模組 1: RAG 簡介

模組 2: 資訊檢索與搜尋基礎

模組 3: 使用向量資料庫進行資訊檢索

模組 4: RAG 中的大型語言模型

模組 5: 生產、評估與部署

技術棧與工具

核心工具

涉及技術

實際應用領域

學習成果

前置要求

課程特色

🎯 實踐導向

📚 系統性學習

🏆 獲得認證

RAG 的重要性

為何需要 RAG？

RAG 的應用場景

學習建議

課程存取

相關課程推薦

總結