Home
Login

II-Agent 是一個開源智慧助手框架,旨在跨多個領域簡化和增強工作流程,能夠獨立執行複雜任務

Apache-2.0Python 2.5kIntelligent-Internetii-agent Last Updated: 2025-06-25

II-Agent 項目詳細介紹

項目概述

II-Agent 是一個開源智能助手,旨在跨多個領域簡化和增強工作流程。它代表了我們與技術互動方式的重大進步——從被動工具轉向能夠獨立執行複雜任務的智能系統。

項目地址: https://github.com/Intelligent-Internet/ii-agent

核心特性

II Agent 圍繞為 Anthropic Claude 模型提供代理介面而構建,提供以下功能:

  • CLI 介面:直接命令行互動
  • WebSocket 伺服器:支持現代 React 前端
  • Google Cloud Vertex AI 整合:通過 API 訪問 Anthropic 模型

應用領域和功能

領域 II-Agent 的功能
研究與事實核查 多步驟網路搜尋、資訊源三角驗證、結構化筆記、快速摘要
內容生成 部落格和文章草稿、課程計畫、創意散文、技術手冊、網站創建
數據分析與可視化 數據清理、統計分析、趨勢檢測、圖表製作、自動報告生成
軟體開發 代碼合成、重構、除錯、測試編寫、多語言分步教程
工作流自動化 腳本生成、瀏覽器自動化、文件管理、流程優化
問題解決 問題分解、替代路徑探索、分步指導、故障排除

系統架構

II-Agent 系統採用複雜的方法構建多功能 AI 代理,核心方法包括:

1. 核心代理架構和 LLM 互動

  • 動態定制上下文的系統提示
  • 全面的互動歷史管理
  • 智能上下文管理以處理令牌限制
  • 系統化 LLM 調用和功能選擇
  • 通過執行週期進行迭代優化

2. 規劃和反思

  • 複雜問題解決的結構化推理
  • 問題分解和順序思考
  • 透明的決策過程
  • 假設形成和測試

3. 執行能力

  • 智能代碼編輯的文件系統操作
  • 安全環境中的命令行執行
  • 高級網路互動和瀏覽器自動化
  • 任務完成和報告
  • 各種模態的專用功能(實驗性):PDF、音訊、圖像、影片、幻燈片
  • 深度研究整合

4. 上下文管理

  • 令牌使用估計和優化
  • 長互動的策略性截斷
  • 大輸出的基於文件的存檔

5. 實時通信

  • 基於 WebSocket 的互動式介面
  • 每個客戶端的隔離代理實例
  • 響應式用戶體驗的流式操作事件

性能評估

II-Agent 已在 GAIA 基准測試上進行評估,該基准測試評估在現實場景中運行的基於 LLM 的代理,涵蓋多個維度,包括多模態處理、工具利用和網路搜尋。

在評估過程中發現了 GAIA 基准測試的幾個問題:

  • 註釋錯誤:數據集中的幾個不正確註釋
  • 過時資訊:一些問題引用了不再可訪問的網站或內容
  • 語言模糊性:措辭不清導致對問題的不同解釋

儘管面臨這些挑戰,II-Agent 在基准測試中表現出色,特別是在需要複雜推理、工具使用和多步規劃的領域。

安裝和配置

系統要求

  • Python 3.10+
  • Node.js 18+(用於前端)
  • 啟用 Vertex AI API 的 Google Cloud 項目或 Anthropic API 密鑰

環境配置

在根目錄創建 .env 文件:

# 圖像和影片生成工具
OPENAI_API_KEY=your_openai_key
OPENAI_AZURE_ENDPOINT=your_azure_endpoint

# 搜尋提供商
TAVILY_API_KEY=your_tavily_key
#JINA_API_KEY=your_jina_key
#FIRECRAWL_API_KEY=your_firecrawl_key

# 用於圖像搜尋和更好的搜尋結果,使用 SerpAPI
#SERPAPI_API_KEY=your_serpapi_key

STATIC_FILE_BASE_URL=http://localhost:8000/

# 如果使用 Anthropic 客戶端
ANTHROPIC_API_KEY=

# 如果使用 Google Vertex(推薦,如果有權限可獲得額外吞吐量)
#GOOGLE_APPLICATION_CREDENTIALS=

前端環境配置,在 frontend 目錄創建 .env 文件:

NEXT_PUBLIC_API_URL=http://localhost:8000

安裝步驟

  1. 克隆倉庫

  2. 設置 Python 環境

python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
pip install -e .
  1. 設置前端(可選)
cd frontend
npm install

使用方法

CLI 使用

使用 Anthropic 客戶端:

python cli.py

使用 Vertex:

python cli.py --project-id YOUR_PROJECT_ID --region YOUR_REGION

CLI 選項:

  • --project-id: Google Cloud 項目 ID
  • --region: Google Cloud 區域(如 us-east5)
  • --workspace: 工作空間目錄路徑(默認:./workspace)
  • --needs-permission: 執行命令前需要權限
  • --minimize-stdout-logs: 減少打印到 stdout 的日誌量

Web 介面使用

  1. 啟動 WebSocket 伺服器

使用 Anthropic 客戶端:

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000

使用 Vertex:

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000 --project-id YOUR_PROJECT_ID --region YOUR_REGION
  1. 啟動前端(在單獨的終端中):
cd frontend
npm run dev
  1. 打開瀏覽器訪問 http://localhost:3000

項目結構

  • cli.py: 命令行介面
  • ws_server.py: 前端 WebSocket 伺服器
  • src/ii_agent/: 核心代理實現
    • agents/: 代理實現
    • llm/: LLM 客戶端介面
    • tools/: 工具實現
    • utils/: 實用函數

技術特點

II-Agent 框架圍繞 Claude 3.7 Sonnet 等大型語言模型的推理能力架構,呈現了構建多功能 AI 代理的全面而強大的方法。通過強大 LLM、豐富執行能力集合、明確的規劃和反思機制以及智能上下文管理策略的協同組合,II-Agent 能夠處理廣泛的複雜多步任務。

總結

II-Agent 代表了智能代理技術的重要進步,其開源性質和可擴展設計為在快速發展的代理 AI 領域進行持續研究和開發提供了堅實的基礎。通過其多領域應用能力和強大的技術架構,II-Agent 為用戶提供了一個功能全面、易於使用的智能助手平台。

Star History Chart