YouTube評論智能摘要生成器
YouTube Comment Summarizer
利用RAG技術和向量資料庫自動分析YouTube評論,生成智能摘要,幫助創作者快速了解觀眾回饋和輿情趨勢
工作流概述
這是一個基於 N8n 構建的 YouTube 評論摘要生成器工作流,利用 RAG(檢索增強生成)技術來處理和分析 YouTube 評論數據。該工作流整合了向量資料庫、AI 語言模型和多個第三方服務,實現了從數據接收到結果儲存的完整自動化流程。
核心功能
該工作流的主要功能是接收 YouTube 評論數據,透過向量化儲存和 AI 代理處理,生成智慧摘要並記錄處理結果。整個流程包含數據攝取、文字處理、向量化儲存、智慧檢索和結果輸出等多個環節。
節點架構
1. 觸發器節點
- Webhook Trigger:透過 POST 請求接收數據
- 路徑:
youtube-comment-summarizer - 作為整個工作流的入口點
- 路徑:
2. 數據處理層
- Text Splitter:文字分割器
- 分塊大小:400 字元
- 重疊部分:40 字元
- 用於將長文字分割成適合處理的小塊
3. 向量化層
- Embeddings (OpenAI):文字嵌入生成器
- 模型:
text-embedding-3-small - 將文字轉換為向量表示
- 整合 OpenAI API
- 模型:
4. 向量儲存層
Pinecone Insert:向量插入節點
- 索引名稱:
youtube_comment_summarizer - 模式:插入模式
- 用於儲存文字向量至 Pinecone 資料庫
- 索引名稱:
Pinecone Query:向量查詢節點
- 索引名稱:
youtube_comment_summarizer - 用於從向量資料庫檢索相關內容
- 索引名稱:
5. AI 代理層
Vector Tool:向量工具
- 名稱:Pinecone
- 描述:Vector context
- 為 AI 代理提供向量檢索能力
Window Memory:視窗記憶
- 版本:1.3
- 維護對話上下文記憶
Chat Model (OpenAI):聊天模型
- 使用 OpenAI 語言模型
- 作為 AI 代理的核心推理引擎
RAG Agent:檢索增強生成代理
- 提示類型:自訂
- 系統訊息:You are an assistant for YouTube Comment Summarizer
- 整合向量工具和記憶功能
6. 輸出層
Append Sheet (Google Sheets):數據記錄節點
- 操作:附加數據
- 工作表:Log
- 記錄處理狀態
Slack Alert:錯誤通知節點
- 頻道:#alerts
- 當工作流出錯時傳送通知
數據流向
Webhook 接收
↓
文字分割 → 向量化 → Pinecone 儲存
↓ ↓
視窗記憶 ← RAG 代理 ← 向量查詢
↓
Google Sheets 記錄
↓ (錯誤時)
Slack 告警
工作流程詳解
- 數據接收階段
- Webhook 接收 POST 請求中的 YouTube 評論數據
- 數據同時傳遞給文字分割器和視窗記憶
- 向量化處理階段
- 文字分割器將評論內容切分成小塊
- 每個文字塊透過 OpenAI Embeddings 轉換為向量
- 向量數據儲存至 Pinecone 資料庫
- 智慧檢索階段
- Pinecone Query 節點檢索相關向量內容
- 向量工具將檢索結果提供給 RAG 代理
- 視窗記憶維護對話歷史上下文
- AI 生成階段
- RAG 代理使用 OpenAI Chat Model 進行推理
- 結合向量檢索結果和對話記憶生成摘要
- 生成智慧化的評論分析與摘要
- 結果輸出階段
- 處理結果附加至 Google Sheets 日誌表
- 若發生錯誤,透過 Slack 傳送告警通知
技術整合
API 整合
- OpenAI API:提供文字嵌入和語言模型服務
- Pinecone API:提供向量資料庫儲存與檢索
- Google Sheets API:提供數據記錄功能
- Slack API:提供錯誤通知功能
設定要點
- 所有 API 憑證皆以 ID 引用方式設定
- Pinecone 索引名稱保持一致性
- 文字分塊參數經過最佳化,以平衡效能與效果
應用場景
- YouTube 內容創作者
- 快速掌握觀眾評論的整體情緒與主要關注點
- 識別熱門話題與常見問題
- 品牌行銷團隊
- 監控品牌相關影片的評論回饋
- 分析使用者情緒與意見趨勢
- 研究人員
- 收集與分析特定主題的公眾意見
- 進行社群媒體情緒分析研究
- 客戶支援團隊
- 識別產品相關影片中的常見問題
- 快速回應客戶關注點
優勢特點
- 智慧化處理:運用 RAG 技術提供具上下文感知的摘要
- 可擴充性:向量資料庫支援大規模評論數據儲存
- 自動化:全流程自動化,減少人工干預
- 可靠性:內建錯誤處理與告警機制
- 記錄追溯:所有處理記錄儲存於 Google Sheets
潛在優化方向
- 批次處理:增加批次處理能力以提升效率
- 多語言支援:加入語言偵測與翻譯功能
- 情緒分析:整合專門的情緒分析工具
- 數據視覺化:新增數據視覺化儀表板
- 快取機制:實作智慧快取以降低 API 呼叫成本
節點清單
| 節點名稱 | 節點類型 | 主要功能 |
|---|---|---|
| Sticky Note | n8n-nodes-base.stickyNote | 工作流說明 |
| Webhook Trigger | n8n-nodes-base.webhook | 接收 HTTP 請求 |
| Text Splitter | @n8n/n8n-nodes-langchain.textSplitterCharacterTextSplitter | 文字分塊 |
| Embeddings | @n8n/n8n-nodes-langchain.embeddingsOpenAi | 文字向量化 |
| Pinecone Insert | @n8n/n8n-nodes-langchain.vectorStorePinecone | 向量儲存 |
| Pinecone Query | @n8n/n8n-nodes-langchain.vectorStorePinecone | 向量檢索 |
| Vector Tool | @n8n/n8n-nodes-langchain.toolVectorStore | 向量工具 |
| Window Memory | @n8n/n8n-nodes-langchain.memoryBufferWindow | 對話記憶 |
| Chat Model | @n8n/n8n-nodes-langchain.lmChatOpenAi | AI 語言模型 |
| RAG Agent | @n8n/n8n-nodes-langchain.agent | RAG 代理 |
| Append Sheet | n8n-nodes-base.googleSheets | 數據記錄 |
| Slack Alert | n8n-nodes-base.slack | 錯誤通知 |
技術棧
- 工作流引擎:N8n
- AI 框架:LangChain
- 語言模型:OpenAI GPT
- 向量資料庫:Pinecone
- 數據儲存:Google Sheets
- 通知服務:Slack
總結
這是一個設計精良的 RAG 工作流模板,充分運用現代 AI 技術棧來實現 YouTube 評論的智慧化處理。透過向量資料庫與語言模型的結合,能夠提供高品質的評論摘要與分析服務。此工作流具備良好的擴充性與可維護性,適合作為企業級應用的基礎架構。