Intelligent-Internet/ii-agentView GitHub Homepage for Latest Official Releases
II-Agent是一个开源智能助手框架,旨在跨多个领域简化和增强工作流程,能够独立执行复杂任务
Apache-2.0Pythonii-agentIntelligent-Internet 2.8k Last Updated: August 13, 2025
II-Agent 项目详细介绍
项目概述
II-Agent是一个开源智能助手,旨在跨多个领域简化和增强工作流程。它代表了我们与技术交互方式的重大进步——从被动工具转向能够独立执行复杂任务的智能系统。
项目地址: https://github.com/Intelligent-Internet/ii-agent
核心特性
II Agent围绕为Anthropic Claude模型提供代理接口而构建,提供以下功能:
- CLI界面:直接命令行交互
- WebSocket服务器:支持现代React前端
- Google Cloud Vertex AI集成:通过API访问Anthropic模型
应用领域和功能
领域 | II-Agent的功能 |
---|---|
研究与事实核查 | 多步骤网络搜索、信息源三角验证、结构化笔记、快速摘要 |
内容生成 | 博客和文章草稿、课程计划、创意散文、技术手册、网站创建 |
数据分析与可视化 | 数据清理、统计分析、趋势检测、图表制作、自动报告生成 |
软件开发 | 代码合成、重构、调试、测试编写、多语言分步教程 |
工作流自动化 | 脚本生成、浏览器自动化、文件管理、流程优化 |
问题解决 | 问题分解、替代路径探索、分步指导、故障排除 |
系统架构
II-Agent系统采用复杂的方法构建多功能AI代理,核心方法包括:
1. 核心代理架构和LLM交互
- 动态定制上下文的系统提示
- 全面的交互历史管理
- 智能上下文管理以处理令牌限制
- 系统化LLM调用和功能选择
- 通过执行周期进行迭代优化
2. 规划和反思
- 复杂问题解决的结构化推理
- 问题分解和顺序思考
- 透明的决策过程
- 假设形成和测试
3. 执行能力
- 智能代码编辑的文件系统操作
- 安全环境中的命令行执行
- 高级网络交互和浏览器自动化
- 任务完成和报告
- 各种模态的专用功能(实验性):PDF、音频、图像、视频、幻灯片
- 深度研究集成
4. 上下文管理
- 令牌使用估计和优化
- 长交互的策略性截断
- 大输出的基于文件的存档
5. 实时通信
- 基于WebSocket的交互式界面
- 每个客户端的隔离代理实例
- 响应式用户体验的流式操作事件
性能评估
II-Agent已在GAIA基准测试上进行评估,该基准测试评估在现实场景中运行的基于LLM的代理,涵盖多个维度,包括多模态处理、工具利用和网络搜索。
在评估过程中发现了GAIA基准测试的几个问题:
- 注释错误:数据集中的几个不正确注释
- 过时信息:一些问题引用了不再可访问的网站或内容
- 语言模糊性:措辞不清导致对问题的不同解释
尽管面临这些挑战,II-Agent在基准测试中表现出色,特别是在需要复杂推理、工具使用和多步规划的领域。
安装和配置
系统要求
- Python 3.10+
- Node.js 18+(用于前端)
- 启用Vertex AI API的Google Cloud项目或Anthropic API密钥
环境配置
在根目录创建.env
文件:
# 图像和视频生成工具
OPENAI_API_KEY=your_openai_key
OPENAI_AZURE_ENDPOINT=your_azure_endpoint
# 搜索提供商
TAVILY_API_KEY=your_tavily_key
#JINA_API_KEY=your_jina_key
#FIRECRAWL_API_KEY=your_firecrawl_key
# 用于图像搜索和更好的搜索结果,使用SerpAPI
#SERPAPI_API_KEY=your_serpapi_key
STATIC_FILE_BASE_URL=http://localhost:8000/
# 如果使用Anthropic客户端
ANTHROPIC_API_KEY=
# 如果使用Google Vertex(推荐,如果有权限可获得额外吞吐量)
#GOOGLE_APPLICATION_CREDENTIALS=
前端环境配置,在frontend目录创建.env
文件:
NEXT_PUBLIC_API_URL=http://localhost:8000
安装步骤
克隆仓库
设置Python环境:
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install -e .
- 设置前端(可选):
cd frontend
npm install
使用方法
CLI使用
使用Anthropic客户端:
python cli.py
使用Vertex:
python cli.py --project-id YOUR_PROJECT_ID --region YOUR_REGION
CLI选项:
--project-id
: Google Cloud项目ID--region
: Google Cloud区域(如us-east5)--workspace
: 工作空间目录路径(默认:./workspace)--needs-permission
: 执行命令前需要权限--minimize-stdout-logs
: 减少打印到stdout的日志量
Web界面使用
- 启动WebSocket服务器:
使用Anthropic客户端:
export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000
使用Vertex:
export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000 --project-id YOUR_PROJECT_ID --region YOUR_REGION
- 启动前端(在单独的终端中):
cd frontend
npm run dev
- 打开浏览器访问 http://localhost:3000
项目结构
cli.py
: 命令行界面ws_server.py
: 前端WebSocket服务器src/ii_agent/
: 核心代理实现agents/
: 代理实现llm/
: LLM客户端接口tools/
: 工具实现utils/
: 实用函数
技术特点
II-Agent框架围绕Claude 3.7 Sonnet等大型语言模型的推理能力架构,呈现了构建多功能AI代理的全面而强大的方法。通过强大LLM、丰富执行能力集合、明确的规划和反思机制以及智能上下文管理策略的协同组合,II-Agent能够处理广泛的复杂多步任务。
总结
II-Agent代表了智能代理技术的重要进步,其开源性质和可扩展设计为在快速发展的代理AI领域进行持续研究和开发提供了坚实的基础。通过其多领域应用能力和强大的技术架构,II-Agent为用户提供了一个功能全面、易于使用的智能助手平台。