Home
Login

II-Agent是一个开源智能助手框架,旨在跨多个领域简化和增强工作流程,能够独立执行复杂任务

Apache-2.0Python 2.5kIntelligent-Internetii-agent Last Updated: 2025-06-25

II-Agent 项目详细介绍

项目概述

II-Agent是一个开源智能助手,旨在跨多个领域简化和增强工作流程。它代表了我们与技术交互方式的重大进步——从被动工具转向能够独立执行复杂任务的智能系统。

项目地址: https://github.com/Intelligent-Internet/ii-agent

核心特性

II Agent围绕为Anthropic Claude模型提供代理接口而构建,提供以下功能:

  • CLI界面:直接命令行交互
  • WebSocket服务器:支持现代React前端
  • Google Cloud Vertex AI集成:通过API访问Anthropic模型

应用领域和功能

领域 II-Agent的功能
研究与事实核查 多步骤网络搜索、信息源三角验证、结构化笔记、快速摘要
内容生成 博客和文章草稿、课程计划、创意散文、技术手册、网站创建
数据分析与可视化 数据清理、统计分析、趋势检测、图表制作、自动报告生成
软件开发 代码合成、重构、调试、测试编写、多语言分步教程
工作流自动化 脚本生成、浏览器自动化、文件管理、流程优化
问题解决 问题分解、替代路径探索、分步指导、故障排除

系统架构

II-Agent系统采用复杂的方法构建多功能AI代理,核心方法包括:

1. 核心代理架构和LLM交互

  • 动态定制上下文的系统提示
  • 全面的交互历史管理
  • 智能上下文管理以处理令牌限制
  • 系统化LLM调用和功能选择
  • 通过执行周期进行迭代优化

2. 规划和反思

  • 复杂问题解决的结构化推理
  • 问题分解和顺序思考
  • 透明的决策过程
  • 假设形成和测试

3. 执行能力

  • 智能代码编辑的文件系统操作
  • 安全环境中的命令行执行
  • 高级网络交互和浏览器自动化
  • 任务完成和报告
  • 各种模态的专用功能(实验性):PDF、音频、图像、视频、幻灯片
  • 深度研究集成

4. 上下文管理

  • 令牌使用估计和优化
  • 长交互的策略性截断
  • 大输出的基于文件的存档

5. 实时通信

  • 基于WebSocket的交互式界面
  • 每个客户端的隔离代理实例
  • 响应式用户体验的流式操作事件

性能评估

II-Agent已在GAIA基准测试上进行评估,该基准测试评估在现实场景中运行的基于LLM的代理,涵盖多个维度,包括多模态处理、工具利用和网络搜索。

在评估过程中发现了GAIA基准测试的几个问题:

  • 注释错误:数据集中的几个不正确注释
  • 过时信息:一些问题引用了不再可访问的网站或内容
  • 语言模糊性:措辞不清导致对问题的不同解释

尽管面临这些挑战,II-Agent在基准测试中表现出色,特别是在需要复杂推理、工具使用和多步规划的领域。

安装和配置

系统要求

  • Python 3.10+
  • Node.js 18+(用于前端)
  • 启用Vertex AI API的Google Cloud项目或Anthropic API密钥

环境配置

在根目录创建.env文件:

# 图像和视频生成工具
OPENAI_API_KEY=your_openai_key
OPENAI_AZURE_ENDPOINT=your_azure_endpoint

# 搜索提供商
TAVILY_API_KEY=your_tavily_key
#JINA_API_KEY=your_jina_key
#FIRECRAWL_API_KEY=your_firecrawl_key

# 用于图像搜索和更好的搜索结果,使用SerpAPI
#SERPAPI_API_KEY=your_serpapi_key

STATIC_FILE_BASE_URL=http://localhost:8000/

# 如果使用Anthropic客户端
ANTHROPIC_API_KEY=

# 如果使用Google Vertex(推荐,如果有权限可获得额外吞吐量)
#GOOGLE_APPLICATION_CREDENTIALS=

前端环境配置,在frontend目录创建.env文件:

NEXT_PUBLIC_API_URL=http://localhost:8000

安装步骤

  1. 克隆仓库

  2. 设置Python环境

python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
pip install -e .
  1. 设置前端(可选)
cd frontend
npm install

使用方法

CLI使用

使用Anthropic客户端:

python cli.py

使用Vertex:

python cli.py --project-id YOUR_PROJECT_ID --region YOUR_REGION

CLI选项:

  • --project-id: Google Cloud项目ID
  • --region: Google Cloud区域(如us-east5)
  • --workspace: 工作空间目录路径(默认:./workspace)
  • --needs-permission: 执行命令前需要权限
  • --minimize-stdout-logs: 减少打印到stdout的日志量

Web界面使用

  1. 启动WebSocket服务器

使用Anthropic客户端:

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000

使用Vertex:

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000 --project-id YOUR_PROJECT_ID --region YOUR_REGION
  1. 启动前端(在单独的终端中):
cd frontend
npm run dev
  1. 打开浏览器访问 http://localhost:3000

项目结构

  • cli.py: 命令行界面
  • ws_server.py: 前端WebSocket服务器
  • src/ii_agent/: 核心代理实现
    • agents/: 代理实现
    • llm/: LLM客户端接口
    • tools/: 工具实现
    • utils/: 实用函数

技术特点

II-Agent框架围绕Claude 3.7 Sonnet等大型语言模型的推理能力架构,呈现了构建多功能AI代理的全面而强大的方法。通过强大LLM、丰富执行能力集合、明确的规划和反思机制以及智能上下文管理策略的协同组合,II-Agent能够处理广泛的复杂多步任务。

总结

II-Agent代表了智能代理技术的重要进步,其开源性质和可扩展设计为在快速发展的代理AI领域进行持续研究和开发提供了坚实的基础。通过其多领域应用能力和强大的技术架构,II-Agent为用户提供了一个功能全面、易于使用的智能助手平台。

Star History Chart