Intelligent-Internet/ii-agentView GitHub Homepage for Latest Official Releases

II-Agent 是一個開源智慧助手框架，旨在跨多個領域簡化和增強工作流程，能夠獨立執行複雜任務

Apache-2.0Pythonii-agentIntelligent-Internet 2.8k Last Updated: August 13, 2025

II-Agent 項目詳細介紹

項目概述

II-Agent 是一個開源智能助手，旨在跨多個領域簡化和增強工作流程。它代表了我們與技術互動方式的重大進步——從被動工具轉向能夠獨立執行複雜任務的智能系統。

項目地址: https://github.com/Intelligent-Internet/ii-agent

核心特性

II Agent 圍繞為 Anthropic Claude 模型提供代理介面而構建，提供以下功能：

CLI 介面：直接命令行互動
WebSocket 伺服器：支持現代 React 前端
Google Cloud Vertex AI 整合：通過 API 訪問 Anthropic 模型

應用領域和功能

領域	II-Agent 的功能
研究與事實核查	多步驟網路搜尋、資訊源三角驗證、結構化筆記、快速摘要
內容生成	部落格和文章草稿、課程計畫、創意散文、技術手冊、網站創建
數據分析與可視化	數據清理、統計分析、趨勢檢測、圖表製作、自動報告生成
軟體開發	代碼合成、重構、除錯、測試編寫、多語言分步教程
工作流自動化	腳本生成、瀏覽器自動化、文件管理、流程優化
問題解決	問題分解、替代路徑探索、分步指導、故障排除

系統架構

II-Agent 系統採用複雜的方法構建多功能 AI 代理，核心方法包括：

1. 核心代理架構和 LLM 互動

動態定制上下文的系統提示
全面的互動歷史管理
智能上下文管理以處理令牌限制
系統化 LLM 調用和功能選擇
通過執行週期進行迭代優化

2. 規劃和反思

複雜問題解決的結構化推理
問題分解和順序思考
透明的決策過程
假設形成和測試

3. 執行能力

智能代碼編輯的文件系統操作
安全環境中的命令行執行
高級網路互動和瀏覽器自動化
任務完成和報告
各種模態的專用功能（實驗性）：PDF、音訊、圖像、影片、幻燈片
深度研究整合

4. 上下文管理

令牌使用估計和優化
長互動的策略性截斷
大輸出的基於文件的存檔

5. 實時通信

基於 WebSocket 的互動式介面
每個客戶端的隔離代理實例
響應式用戶體驗的流式操作事件

性能評估

II-Agent 已在 GAIA 基准測試上進行評估，該基准測試評估在現實場景中運行的基於 LLM 的代理，涵蓋多個維度，包括多模態處理、工具利用和網路搜尋。

在評估過程中發現了 GAIA 基准測試的幾個問題：

註釋錯誤：數據集中的幾個不正確註釋
過時資訊：一些問題引用了不再可訪問的網站或內容
語言模糊性：措辭不清導致對問題的不同解釋

儘管面臨這些挑戰，II-Agent 在基准測試中表現出色，特別是在需要複雜推理、工具使用和多步規劃的領域。

安裝和配置

系統要求

Python 3.10+
Node.js 18+（用於前端）
啟用 Vertex AI API 的 Google Cloud 項目或 Anthropic API 密鑰

環境配置

在根目錄創建 .env 文件：

# 圖像和影片生成工具
OPENAI_API_KEY=your_openai_key
OPENAI_AZURE_ENDPOINT=your_azure_endpoint

# 搜尋提供商
TAVILY_API_KEY=your_tavily_key
#JINA_API_KEY=your_jina_key
#FIRECRAWL_API_KEY=your_firecrawl_key

# 用於圖像搜尋和更好的搜尋結果，使用 SerpAPI
#SERPAPI_API_KEY=your_serpapi_key

STATIC_FILE_BASE_URL=http://localhost:8000/

# 如果使用 Anthropic 客戶端
ANTHROPIC_API_KEY=

# 如果使用 Google Vertex（推薦，如果有權限可獲得額外吞吐量）
#GOOGLE_APPLICATION_CREDENTIALS=

前端環境配置，在 frontend 目錄創建 .env 文件：

NEXT_PUBLIC_API_URL=http://localhost:8000

安裝步驟

克隆倉庫
設置 Python 環境：

python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
pip install -e .

設置前端（可選）：

cd frontend
npm install

使用方法

CLI 使用

使用 Anthropic 客戶端：

python cli.py

使用 Vertex：

python cli.py --project-id YOUR_PROJECT_ID --region YOUR_REGION

CLI 選項：

--project-id: Google Cloud 項目 ID
--region: Google Cloud 區域（如 us-east5）
--workspace: 工作空間目錄路徑（默認：./workspace）
--needs-permission: 執行命令前需要權限
--minimize-stdout-logs: 減少打印到 stdout 的日誌量

Web 介面使用

啟動 WebSocket 伺服器：

使用 Anthropic 客戶端：

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000

使用 Vertex：

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000 --project-id YOUR_PROJECT_ID --region YOUR_REGION

啟動前端（在單獨的終端中）：

cd frontend
npm run dev

打開瀏覽器訪問 http://localhost:3000

項目結構

cli.py: 命令行介面
ws_server.py: 前端 WebSocket 伺服器
src/ii_agent/: 核心代理實現
- agents/: 代理實現
- llm/: LLM 客戶端介面
- tools/: 工具實現
- utils/: 實用函數

技術特點

II-Agent 框架圍繞 Claude 3.7 Sonnet 等大型語言模型的推理能力架構，呈現了構建多功能 AI 代理的全面而強大的方法。通過強大 LLM、豐富執行能力集合、明確的規劃和反思機制以及智能上下文管理策略的協同組合，II-Agent 能夠處理廣泛的複雜多步任務。

總結

II-Agent 代表了智能代理技術的重要進步，其開源性質和可擴展設計為在快速發展的代理 AI 領域進行持續研究和開發提供了堅實的基礎。通過其多領域應用能力和強大的技術架構，II-Agent 為用戶提供了一個功能全面、易於使用的智能助手平台。