基于 Claude 驱动的开源自主 AI 科学家,能够自动执行完整的科学研究循环:文献分析、假设生成、实验设计、执行分析和迭代改进
Kosmos - 自主AI科学家平台详细介绍
项目概述
Kosmos 是一个开源的自主AI科学家实现,能够执行完整的科学研究循环:从文献分析和假设生成,到实验设计、执行、分析和迭代改进。该项目基于 2025年11月发布的 Kosmos AI 论文(https://arxiv.org/abs/2511.02824),并适配为可由 Claude Code 或 Anthropic API 驱动的实现。
核心特性
🔬 自主研究循环
- 端到端科学工作流: 完整的研究周期自动化
- 多领域支持: 生物学、物理学、化学、神经科学、材料科学
- 迭代改进: 基于结果自动优化假设和实验设计
🤖 AI驱动的智能系统
- Claude Sonnet 4 驱动: 用于假设生成和高级分析
- 多模型支持: 支持 Anthropic Claude、OpenAI GPT 和本地模型(Ollama、LM Studio)
- 智能模型选择: 根据任务复杂度自动选择最优模型
🔧 灵活的集成方式
- 双重集成选项:
- 选项A: Anthropic API(按使用付费)
- 选项B: Claude Code CLI(需要 Max 订阅)
- 成熟的分析模式: 集成来自 kosmos-figures 的经过实战验证的统计方法
📚 文献集成
- 自动化论文搜索: 支持 arXiv、Semantic Scholar、PubMed
- 文献摘要: 自动提取关键信息
- 新颖性检查: 验证研究假设的创新性
🏗️ 代理架构
- 模块化设计: 每个研究任务对应独立的代理
- 并行执行: 同时运行多个研究任务
- 协同工作: 代理间通过结构化世界模型共享信息
🛡️ 安全优先
- 沙箱执行: 隔离的代码运行环境
- 验证机制: 结果验证和可复现性检查
- 人工审批门: 可选的人工审核环节
💰 成本优化
- 多层缓存系统: 降低 30-40% 的 API 成本
- 智能提示缓存: 使用 Anthropic 时显著节省成本
- 模型选择优化: 根据任务复杂度智能选择模型,降低 15-20% 成本
系统架构
核心组件
┌─────────────────────────────────────────────────────────────┐
│ Research Director │
│ (协调自主研究循环的主控制器) │
└──────────────┬──────────────────────────────────────────────┘
│
┌──────────────┴────────┬───────────────┬──────────────┐
│ │ │ │
┌───▼────┐ ┌─────────▼──────────┐ ┌▼──────────┐ ┌▼─────────────┐
│Literature│ │Hypothesis Generator│ │Experiment │ │Data Analyst │
│Analyzer │ │ (Claude) │ │Designer │ │ (Claude) │
└───┬────┘ └─────────┬──────────┘ └┬──────────┘ └┬─────────────┘
│ │ │ │
└──────────────────┴───────────────┴─────────────┘
│
┌──────────▼──────────┐
│ Execution Engine │
│ (kosmos-figures │
│ proven patterns) │
└─────────────────────┘
代理说明
- Research Director (研究主管): 管理研究工作流的主协调器
- Literature Analyzer (文献分析器): 搜索和分析科学论文(arXiv、Semantic Scholar、PubMed)
- Hypothesis Generator (假设生成器): 使用 Claude 生成可测试的假设
- Experiment Designer (实验设计器): 设计计算实验
- Execution Engine (执行引擎): 使用经过验证的统计方法运行实验
- Data Analyst (数据分析器): 使用 Claude 解释结果
- Feedback Loop (反馈循环): 基于结果迭代改进假设
技术要求
基础要求
- Python 3.11 或 3.12
- 以下之一:
- 选项A: Anthropic API 密钥(按使用付费)
- 选项B: Claude Code CLI 已安装(需要 Max 订阅)
安装指南
基础安装
# 克隆仓库
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos
# 创建虚拟环境
python3.11 -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# 安装依赖
pip install -e .
# 支持 Claude Code CLI (选项B)
pip install -e ".[router]"
选项A: Anthropic API 配置
# 复制示例配置
cp .env.example .env
# 编辑 .env 并设置你的 API 密钥
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here
从 console.anthropic.com 获取你的 API 密钥
优点:
- 按使用付费
- 无需 CLI 安装
- 可在任何地方工作
缺点:
- 按 token 收费
- 有速率限制
选项B: Claude Code CLI 配置
# 1. 安装 Claude Code CLI
# 访问 https://claude.ai/download 按照说明操作
# 2. 认证 Claude CLI
claude auth
# 3. 复制示例配置
cp .env.example .env
# 4. 编辑 .env 并将 API 密钥设置为全9(触发 CLI 路由)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999
这会将所有 API 调用路由到本地 Claude Code CLI,使用你的 Max 订阅,无需按 token 付费。
优点:
- 无按 token 成本
- 无限使用
- 最新的 Claude 模型
- 本地执行
缺点:
- 需要 Claude CLI 安装
- 需要 Max 订阅
数据库初始化
# 运行数据库迁移
alembic upgrade head
# 验证数据库已创建
ls -la kosmos.db
快速开始
基础使用示例
from kosmos import ResearchDirector
# 初始化研究主管
director = ResearchDirector()
# 提出研究问题
question = "睡眠剥夺与记忆巩固之间的关系是什么?"
# 运行自主研究
results = director.conduct_research(
question=question,
domain="neuroscience",
max_iterations=5
)
# 查看结果
print(results.summary)
print(results.key_findings)
配置选项
所有配置通过环境变量进行(参见 .env.example):
核心配置
ANTHROPIC_API_KEY: API 密钥或999...用于 CLI 模式CLAUDE_MODEL: 要使用的模型(仅 API 模式)DATABASE_URL: 数据库连接字符串LOG_LEVEL: 日志详细程度
研究配置
MAX_RESEARCH_ITERATIONS: 最大自主迭代次数ENABLED_DOMAINS: 支持哪些科学领域ENABLED_EXPERIMENT_TYPES: 允许的实验类型MIN_NOVELTY_SCORE: 最小新颖性阈值
安全配置
ENABLE_SAFETY_CHECKS: 代码安全验证MAX_EXPERIMENT_EXECUTION_TIME: 实验超时时间ENABLE_SANDBOXING: 沙箱代码执行REQUIRE_HUMAN_APPROVAL: 人工审批门
性能优化
缓存系统
Kosmos 包含多层缓存系统,可降低 30-40% 的 API 成本:
# 查看缓存性能
kosmos cache --stats
# 示例输出:
# 总体缓存性能:
# 总请求数: 500
# 缓存命中: 175 (35%)
# 估计节省成本: $15.75
注意: 显著节省成本的提示缓存目前仅在使用 Anthropic Claude 时可用。OpenAI 和本地提供商仅使用内存响应缓存。
智能模型选择
使用 Anthropic 作为 LLM 提供商时,Kosmos 会根据任务复杂度智能选择 Claude 模型:
- Claude Sonnet 4.5: 复杂推理、假设生成、分析
- Claude Haiku 4: 简单任务、数据提取、格式化
这将成本降低 15-20%,同时保持质量。
注意: 此功能特定于 Anthropic Claude。
项目结构
kosmos/
├── core/ # 核心基础设施(LLM、配置、日志)
├── agents/ # 代理实现
├── db/ # 数据库模型和操作
├── execution/ # 实验执行引擎
├── analysis/ # 结果分析和可视化
├── hypothesis/ # 假设生成和管理
├── experiments/ # 实验模板
├── literature/ # 文献搜索和分析
├── knowledge/ # 知识图谱和语义搜索
├── domains/ # 领域特定工具(生物学、物理学等)
├── safety/ # 安全检查和验证
└── cli/ # 命令行接口
tests/
├── unit/ # 单元测试
├── integration/ # 集成测试
└── e2e/ # 端到端测试
docs/
├── kosmos-figures-analysis.md # kosmos-figures 的分析模式
├── integration-plan.md # 集成策略
└── domain-roadmaps/ # 领域特定指南
开发测试
# 安装开发依赖
pip install -e ".[dev]"
# 运行所有测试
pytest
# 运行覆盖率测试
pytest --cov=kosmos --cov-report=html
# 运行特定测试套件
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/
# 代码格式化
black kosmos/ tests/
# 代码检查
ruff check kosmos/ tests/
# 类型检查
mypy kosmos/
开发路线图
✅ 已完成(10个阶段)
第1阶段:项目基础 ✅
- 项目结构
- Claude 集成(API + CLI)
- 配置系统
- 代理框架
- 数据库设置
第2阶段:文献能力 ✅
- 文献 API(arXiv、Semantic Scholar、PubMed)
- 文献分析代理
- 语义搜索向量数据库
- 知识图谱
第3阶段:假设生成 ✅
- 假设生成器代理
- 新颖性检查
- 假设优先级排序
第4阶段:实验设计 ✅
- 实验设计器代理
- 协议模板
- 资源估算
第5阶段:实验执行 ✅
- 沙箱执行环境
- 集成 kosmos-figures 模式
- 统计分析
第6阶段:结果分析 ✅
- 数据分析代理
- 可视化生成
- 结果摘要
第7阶段:研究编排 ✅
- 研究主管代理
- 反馈循环
- 收敛检测
第8阶段:安全与验证 ✅
- 安全验证
- 领域特定工具
第9阶段:生产部署 ✅
- 性能优化(20-40× 提升)
- 多层缓存系统
- 综合测试(90%+ 覆盖率)
第10阶段:文档与完善 ✅
- 丰富的文档(10,000+ 行)
- 用户指南
- API 文档
- 示例代码
科学发现案例
Kosmos 已在多个领域产生了经过验证的科学发现:
1. 代谢组学 - 脑低温保护
独立复现了未发表手稿中的发现,识别出核苷酸代谢是低温小鼠脑中的主要改变途径。
2. 材料科学 - 太阳能电池效率
发现热处理期间的湿度是太阳能电池效率的关键决定因素,并识别出临界湿度阈值。
3. 神经科学 - 神经网络连接
展示了跨物种的脑网络遵循对数正态模式,而非幂律模式。
4. 心脏疾病 - SOD2 保护因子
发现 SOD2 蛋白似乎通过减少纤维化来保护心脏。
5. 糖尿病 - SSR1 基因变异
发现 SSR1 基因附近的遗传变异可能对2型糖尿病具有保护作用。
6. 阿尔茨海默病 - 时序分析方法
提出了一种追踪疾病脑细胞中蛋白质随时间变化的新分析技术。
7. 神经退行性疾病 - 磷脂酰丝氨酸暴露
识别出神经元因年龄相关的翻转酶表达丧失而暴露"吞噬我"信号。
研究效率: 独立科学家发现 Kosmos 报告中 79.4% 的陈述是准确的,合作者报告单次20循环 Kosmos 运行平均相当于他们自己 6 个月的研究时间。
灵感来源
本项目受以下工作启发:
- 论文: Kosmos: An AI Scientist for Autonomous Discovery (2025年11月)
- 分析模式: kosmos-figures 仓库
- Claude Router: claude_n_codex_api_proxy
贡献指南
欢迎贡献!请参见 CONTRIBUTING.md 了解指南。
欢迎的贡献领域:
- 领域特定工具和 API
- 不同领域的实验模板
- 文献 API 集成
- 安全验证
- 文档
- 测试
许可证
MIT License - 详见 LICENSE
引用
如果你在研究中使用 Kosmos,请引用:
@software{kosmos_ai_scientist,
title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
author={Kosmos Contributors},
year={2025},
url={https://github.com/jimmc414/Kosmos}
}
致谢
- Anthropic 提供 Claude 和 Claude Code
- Edison Scientific 提供 kosmos-figures 分析模式
- 开放科学社区提供文献 API 和工具
支持与社区
- Issues: GitHub Issues
- 讨论: GitHub Discussions
项目状态
状态: 生产就绪 (v0.2.0) - 所有10个开发阶段完成
最后更新: 2025-11-07
文档资源
核心优势总结
- 完全自主: 从假设到发现的端到端自动化
- 多领域支持: 跨生物学、物理学、化学等多个领域
- 经过验证: 已产生7项经过验证的科学发现
- 成本优化: 多层缓存降低30-40%成本
- 灵活集成: 支持 API 和 CLI 两种方式
- 安全可靠: 沙箱执行、验证机制、90%+测试覆盖率
- 生产就绪: v0.2.0 版本,所有开发阶段完成