YouTube評論智能摘要生成器

YouTube Comment Summarizer

利用RAG技術和向量資料庫自動分析YouTube評論,生成智能摘要,幫助創作者快速了解觀眾回饋和輿情趨勢

12 NodesAI & MLAI分析社群媒體內容創作

工作流概述

這是一個基於 N8n 構建的 YouTube 評論摘要生成器工作流,利用 RAG(檢索增強生成)技術來處理和分析 YouTube 評論數據。該工作流整合了向量資料庫、AI 語言模型和多個第三方服務,實現了從數據接收到結果儲存的完整自動化流程。

核心功能

該工作流的主要功能是接收 YouTube 評論數據,透過向量化儲存和 AI 代理處理,生成智慧摘要並記錄處理結果。整個流程包含數據攝取、文字處理、向量化儲存、智慧檢索和結果輸出等多個環節。

節點架構

1. 觸發器節點

  • Webhook Trigger:透過 POST 請求接收數據
    • 路徑:youtube-comment-summarizer
    • 作為整個工作流的入口點

2. 數據處理層

  • Text Splitter:文字分割器
    • 分塊大小:400 字元
    • 重疊部分:40 字元
    • 用於將長文字分割成適合處理的小塊

3. 向量化層

  • Embeddings (OpenAI):文字嵌入生成器
    • 模型:text-embedding-3-small
    • 將文字轉換為向量表示
    • 整合 OpenAI API

4. 向量儲存層

  • Pinecone Insert:向量插入節點

    • 索引名稱:youtube_comment_summarizer
    • 模式:插入模式
    • 用於儲存文字向量至 Pinecone 資料庫
  • Pinecone Query:向量查詢節點

    • 索引名稱:youtube_comment_summarizer
    • 用於從向量資料庫檢索相關內容

5. AI 代理層

  • Vector Tool:向量工具

    • 名稱:Pinecone
    • 描述:Vector context
    • 為 AI 代理提供向量檢索能力
  • Window Memory:視窗記憶

    • 版本:1.3
    • 維護對話上下文記憶
  • Chat Model (OpenAI):聊天模型

    • 使用 OpenAI 語言模型
    • 作為 AI 代理的核心推理引擎
  • RAG Agent:檢索增強生成代理

    • 提示類型:自訂
    • 系統訊息:You are an assistant for YouTube Comment Summarizer
    • 整合向量工具和記憶功能

6. 輸出層

  • Append Sheet (Google Sheets):數據記錄節點

    • 操作:附加數據
    • 工作表:Log
    • 記錄處理狀態
  • Slack Alert:錯誤通知節點

    • 頻道:#alerts
    • 當工作流出錯時傳送通知

數據流向

Webhook 接收 
    ↓
文字分割 → 向量化 → Pinecone 儲存
    ↓                    ↓
視窗記憶 ← RAG 代理 ← 向量查詢
              ↓
         Google Sheets 記錄
              ↓ (錯誤時)
         Slack 告警

工作流程詳解

  1. 數據接收階段
  • Webhook 接收 POST 請求中的 YouTube 評論數據
  • 數據同時傳遞給文字分割器和視窗記憶
  1. 向量化處理階段
  • 文字分割器將評論內容切分成小塊
  • 每個文字塊透過 OpenAI Embeddings 轉換為向量
  • 向量數據儲存至 Pinecone 資料庫
  1. 智慧檢索階段
  • Pinecone Query 節點檢索相關向量內容
  • 向量工具將檢索結果提供給 RAG 代理
  • 視窗記憶維護對話歷史上下文
  1. AI 生成階段
  • RAG 代理使用 OpenAI Chat Model 進行推理
  • 結合向量檢索結果和對話記憶生成摘要
  • 生成智慧化的評論分析與摘要
  1. 結果輸出階段
  • 處理結果附加至 Google Sheets 日誌表
  • 若發生錯誤,透過 Slack 傳送告警通知

技術整合

API 整合

  • OpenAI API:提供文字嵌入和語言模型服務
  • Pinecone API:提供向量資料庫儲存與檢索
  • Google Sheets API:提供數據記錄功能
  • Slack API:提供錯誤通知功能

設定要點

  • 所有 API 憑證皆以 ID 引用方式設定
  • Pinecone 索引名稱保持一致性
  • 文字分塊參數經過最佳化,以平衡效能與效果

應用場景

  1. YouTube 內容創作者
  • 快速掌握觀眾評論的整體情緒與主要關注點
  • 識別熱門話題與常見問題
  1. 品牌行銷團隊
  • 監控品牌相關影片的評論回饋
  • 分析使用者情緒與意見趨勢
  1. 研究人員
  • 收集與分析特定主題的公眾意見
  • 進行社群媒體情緒分析研究
  1. 客戶支援團隊
  • 識別產品相關影片中的常見問題
  • 快速回應客戶關注點

優勢特點

  1. 智慧化處理:運用 RAG 技術提供具上下文感知的摘要
  2. 可擴充性:向量資料庫支援大規模評論數據儲存
  3. 自動化:全流程自動化,減少人工干預
  4. 可靠性:內建錯誤處理與告警機制
  5. 記錄追溯:所有處理記錄儲存於 Google Sheets

潛在優化方向

  1. 批次處理:增加批次處理能力以提升效率
  2. 多語言支援:加入語言偵測與翻譯功能
  3. 情緒分析:整合專門的情緒分析工具
  4. 數據視覺化:新增數據視覺化儀表板
  5. 快取機制:實作智慧快取以降低 API 呼叫成本

節點清單

節點名稱 節點類型 主要功能
Sticky Note n8n-nodes-base.stickyNote 工作流說明
Webhook Trigger n8n-nodes-base.webhook 接收 HTTP 請求
Text Splitter @n8n/n8n-nodes-langchain.textSplitterCharacterTextSplitter 文字分塊
Embeddings @n8n/n8n-nodes-langchain.embeddingsOpenAi 文字向量化
Pinecone Insert @n8n/n8n-nodes-langchain.vectorStorePinecone 向量儲存
Pinecone Query @n8n/n8n-nodes-langchain.vectorStorePinecone 向量檢索
Vector Tool @n8n/n8n-nodes-langchain.toolVectorStore 向量工具
Window Memory @n8n/n8n-nodes-langchain.memoryBufferWindow 對話記憶
Chat Model @n8n/n8n-nodes-langchain.lmChatOpenAi AI 語言模型
RAG Agent @n8n/n8n-nodes-langchain.agent RAG 代理
Append Sheet n8n-nodes-base.googleSheets 數據記錄
Slack Alert n8n-nodes-base.slack 錯誤通知

技術棧

  • 工作流引擎:N8n
  • AI 框架:LangChain
  • 語言模型:OpenAI GPT
  • 向量資料庫:Pinecone
  • 數據儲存:Google Sheets
  • 通知服務:Slack

總結

這是一個設計精良的 RAG 工作流模板,充分運用現代 AI 技術棧來實現 YouTube 評論的智慧化處理。透過向量資料庫與語言模型的結合,能夠提供高品質的評論摘要與分析服務。此工作流具備良好的擴充性與可維護性,適合作為企業級應用的基礎架構。