Intelligent-Internet/ii-agentView GitHub Homepage for Latest Official Releases

II-Agent是一个开源智能助手框架，旨在跨多个领域简化和增强工作流程，能够独立执行复杂任务

Apache-2.0Pythonii-agentIntelligent-Internet 2.8k Last Updated: August 13, 2025

II-Agent 项目详细介绍

项目概述

II-Agent是一个开源智能助手，旨在跨多个领域简化和增强工作流程。它代表了我们与技术交互方式的重大进步——从被动工具转向能够独立执行复杂任务的智能系统。

项目地址: https://github.com/Intelligent-Internet/ii-agent

核心特性

II Agent围绕为Anthropic Claude模型提供代理接口而构建，提供以下功能：

CLI界面：直接命令行交互
WebSocket服务器：支持现代React前端
Google Cloud Vertex AI集成：通过API访问Anthropic模型

应用领域和功能

领域	II-Agent的功能
研究与事实核查	多步骤网络搜索、信息源三角验证、结构化笔记、快速摘要
内容生成	博客和文章草稿、课程计划、创意散文、技术手册、网站创建
数据分析与可视化	数据清理、统计分析、趋势检测、图表制作、自动报告生成
软件开发	代码合成、重构、调试、测试编写、多语言分步教程
工作流自动化	脚本生成、浏览器自动化、文件管理、流程优化
问题解决	问题分解、替代路径探索、分步指导、故障排除

系统架构

II-Agent系统采用复杂的方法构建多功能AI代理，核心方法包括：

1. 核心代理架构和LLM交互

动态定制上下文的系统提示
全面的交互历史管理
智能上下文管理以处理令牌限制
系统化LLM调用和功能选择
通过执行周期进行迭代优化

2. 规划和反思

复杂问题解决的结构化推理
问题分解和顺序思考
透明的决策过程
假设形成和测试

3. 执行能力

智能代码编辑的文件系统操作
安全环境中的命令行执行
高级网络交互和浏览器自动化
任务完成和报告
各种模态的专用功能（实验性）：PDF、音频、图像、视频、幻灯片
深度研究集成

4. 上下文管理

令牌使用估计和优化
长交互的策略性截断
大输出的基于文件的存档

5. 实时通信

基于WebSocket的交互式界面
每个客户端的隔离代理实例
响应式用户体验的流式操作事件

性能评估

II-Agent已在GAIA基准测试上进行评估，该基准测试评估在现实场景中运行的基于LLM的代理，涵盖多个维度，包括多模态处理、工具利用和网络搜索。

在评估过程中发现了GAIA基准测试的几个问题：

注释错误：数据集中的几个不正确注释
过时信息：一些问题引用了不再可访问的网站或内容
语言模糊性：措辞不清导致对问题的不同解释

尽管面临这些挑战，II-Agent在基准测试中表现出色，特别是在需要复杂推理、工具使用和多步规划的领域。

安装和配置

系统要求

Python 3.10+
Node.js 18+（用于前端）
启用Vertex AI API的Google Cloud项目或Anthropic API密钥

环境配置

在根目录创建.env文件：

# 图像和视频生成工具
OPENAI_API_KEY=your_openai_key
OPENAI_AZURE_ENDPOINT=your_azure_endpoint

# 搜索提供商
TAVILY_API_KEY=your_tavily_key
#JINA_API_KEY=your_jina_key
#FIRECRAWL_API_KEY=your_firecrawl_key

# 用于图像搜索和更好的搜索结果，使用SerpAPI
#SERPAPI_API_KEY=your_serpapi_key

STATIC_FILE_BASE_URL=http://localhost:8000/

# 如果使用Anthropic客户端
ANTHROPIC_API_KEY=

# 如果使用Google Vertex（推荐，如果有权限可获得额外吞吐量）
#GOOGLE_APPLICATION_CREDENTIALS=

前端环境配置，在frontend目录创建.env文件：

NEXT_PUBLIC_API_URL=http://localhost:8000

安装步骤

克隆仓库
设置Python环境：

python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
pip install -e .

设置前端（可选）：

cd frontend
npm install

使用方法

CLI使用

使用Anthropic客户端：

python cli.py

使用Vertex：

python cli.py --project-id YOUR_PROJECT_ID --region YOUR_REGION

CLI选项：

--project-id: Google Cloud项目ID
--region: Google Cloud区域（如us-east5）
--workspace: 工作空间目录路径（默认：./workspace）
--needs-permission: 执行命令前需要权限
--minimize-stdout-logs: 减少打印到stdout的日志量

Web界面使用

启动WebSocket服务器：

使用Anthropic客户端：

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000

使用Vertex：

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000 --project-id YOUR_PROJECT_ID --region YOUR_REGION

启动前端（在单独的终端中）：

cd frontend
npm run dev

打开浏览器访问 http://localhost:3000

项目结构

cli.py: 命令行界面
ws_server.py: 前端WebSocket服务器
src/ii_agent/: 核心代理实现
- agents/: 代理实现
- llm/: LLM客户端接口
- tools/: 工具实现
- utils/: 实用函数

技术特点

II-Agent框架围绕Claude 3.7 Sonnet等大型语言模型的推理能力架构，呈现了构建多功能AI代理的全面而强大的方法。通过强大LLM、丰富执行能力集合、明确的规划和反思机制以及智能上下文管理策略的协同组合，II-Agent能够处理广泛的复杂多步任务。

总结

II-Agent代表了智能代理技术的重要进步，其开源性质和可扩展设计为在快速发展的代理AI领域进行持续研究和开发提供了坚实的基础。通过其多领域应用能力和强大的技术架构，II-Agent为用户提供了一个功能全面、易于使用的智能助手平台。