基于 Claude 驱动的开源自主 AI 科学家,能够自动执行完整的科学研究循环:文献分析、假设生成、实验设计、执行分析和迭代改进

PythonKosmosjimmc414 308 Last Updated: December 12, 2025

Kosmos - 自主AI科学家平台详细介绍

项目概述

Kosmos 是一个开源的自主AI科学家实现,能够执行完整的科学研究循环:从文献分析和假设生成,到实验设计、执行、分析和迭代改进。该项目基于 2025年11月发布的 Kosmos AI 论文(https://arxiv.org/abs/2511.02824),并适配为可由 Claude Code 或 Anthropic API 驱动的实现。

核心特性

🔬 自主研究循环

  • 端到端科学工作流: 完整的研究周期自动化
  • 多领域支持: 生物学、物理学、化学、神经科学、材料科学
  • 迭代改进: 基于结果自动优化假设和实验设计

🤖 AI驱动的智能系统

  • Claude Sonnet 4 驱动: 用于假设生成和高级分析
  • 多模型支持: 支持 Anthropic Claude、OpenAI GPT 和本地模型(Ollama、LM Studio)
  • 智能模型选择: 根据任务复杂度自动选择最优模型

🔧 灵活的集成方式

  • 双重集成选项:
    • 选项A: Anthropic API(按使用付费)
    • 选项B: Claude Code CLI(需要 Max 订阅)
  • 成熟的分析模式: 集成来自 kosmos-figures 的经过实战验证的统计方法

📚 文献集成

  • 自动化论文搜索: 支持 arXiv、Semantic Scholar、PubMed
  • 文献摘要: 自动提取关键信息
  • 新颖性检查: 验证研究假设的创新性

🏗️ 代理架构

  • 模块化设计: 每个研究任务对应独立的代理
  • 并行执行: 同时运行多个研究任务
  • 协同工作: 代理间通过结构化世界模型共享信息

🛡️ 安全优先

  • 沙箱执行: 隔离的代码运行环境
  • 验证机制: 结果验证和可复现性检查
  • 人工审批门: 可选的人工审核环节

💰 成本优化

  • 多层缓存系统: 降低 30-40% 的 API 成本
  • 智能提示缓存: 使用 Anthropic 时显著节省成本
  • 模型选择优化: 根据任务复杂度智能选择模型,降低 15-20% 成本

系统架构

核心组件

┌─────────────────────────────────────────────────────────────┐
│                    Research Director                         │
│              (协调自主研究循环的主控制器)                      │
└──────────────┬──────────────────────────────────────────────┘
               │
┌──────────────┴────────┬───────────────┬──────────────┐
│                       │               │              │
┌───▼────┐   ┌─────────▼──────────┐  ┌▼──────────┐ ┌▼─────────────┐
│Literature│  │Hypothesis Generator│  │Experiment │ │Data Analyst  │
│Analyzer  │  │     (Claude)       │  │Designer   │ │   (Claude)   │
└───┬────┘   └─────────┬──────────┘  └┬──────────┘ └┬─────────────┘
    │                  │               │             │
    └──────────────────┴───────────────┴─────────────┘
                       │
            ┌──────────▼──────────┐
            │  Execution Engine   │
            │   (kosmos-figures   │
            │   proven patterns)  │
            └─────────────────────┘

代理说明

  • Research Director (研究主管): 管理研究工作流的主协调器
  • Literature Analyzer (文献分析器): 搜索和分析科学论文(arXiv、Semantic Scholar、PubMed)
  • Hypothesis Generator (假设生成器): 使用 Claude 生成可测试的假设
  • Experiment Designer (实验设计器): 设计计算实验
  • Execution Engine (执行引擎): 使用经过验证的统计方法运行实验
  • Data Analyst (数据分析器): 使用 Claude 解释结果
  • Feedback Loop (反馈循环): 基于结果迭代改进假设

技术要求

基础要求

  • Python 3.11 或 3.12
  • 以下之一:
    • 选项A: Anthropic API 密钥(按使用付费)
    • 选项B: Claude Code CLI 已安装(需要 Max 订阅)

安装指南

基础安装

# 克隆仓库
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos

# 创建虚拟环境
python3.11 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# 安装依赖
pip install -e .

# 支持 Claude Code CLI (选项B)
pip install -e ".[router]"

选项A: Anthropic API 配置

# 复制示例配置
cp .env.example .env

# 编辑 .env 并设置你的 API 密钥
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here

console.anthropic.com 获取你的 API 密钥

优点:

  • 按使用付费
  • 无需 CLI 安装
  • 可在任何地方工作

缺点:

  • 按 token 收费
  • 有速率限制

选项B: Claude Code CLI 配置

# 1. 安装 Claude Code CLI
# 访问 https://claude.ai/download 按照说明操作

# 2. 认证 Claude CLI
claude auth

# 3. 复制示例配置
cp .env.example .env

# 4. 编辑 .env 并将 API 密钥设置为全9(触发 CLI 路由)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999

这会将所有 API 调用路由到本地 Claude Code CLI,使用你的 Max 订阅,无需按 token 付费。

优点:

  • 无按 token 成本
  • 无限使用
  • 最新的 Claude 模型
  • 本地执行

缺点:

  • 需要 Claude CLI 安装
  • 需要 Max 订阅

数据库初始化

# 运行数据库迁移
alembic upgrade head

# 验证数据库已创建
ls -la kosmos.db

快速开始

基础使用示例

from kosmos import ResearchDirector

# 初始化研究主管
director = ResearchDirector()

# 提出研究问题
question = "睡眠剥夺与记忆巩固之间的关系是什么?"

# 运行自主研究
results = director.conduct_research(
    question=question,
    domain="neuroscience",
    max_iterations=5
)

# 查看结果
print(results.summary)
print(results.key_findings)

配置选项

所有配置通过环境变量进行(参见 .env.example):

核心配置

  • ANTHROPIC_API_KEY: API 密钥或 999... 用于 CLI 模式
  • CLAUDE_MODEL: 要使用的模型(仅 API 模式)
  • DATABASE_URL: 数据库连接字符串
  • LOG_LEVEL: 日志详细程度

研究配置

  • MAX_RESEARCH_ITERATIONS: 最大自主迭代次数
  • ENABLED_DOMAINS: 支持哪些科学领域
  • ENABLED_EXPERIMENT_TYPES: 允许的实验类型
  • MIN_NOVELTY_SCORE: 最小新颖性阈值

安全配置

  • ENABLE_SAFETY_CHECKS: 代码安全验证
  • MAX_EXPERIMENT_EXECUTION_TIME: 实验超时时间
  • ENABLE_SANDBOXING: 沙箱代码执行
  • REQUIRE_HUMAN_APPROVAL: 人工审批门

性能优化

缓存系统

Kosmos 包含多层缓存系统,可降低 30-40% 的 API 成本:

# 查看缓存性能
kosmos cache --stats

# 示例输出:
# 总体缓存性能:
# 总请求数: 500
# 缓存命中: 175 (35%)
# 估计节省成本: $15.75

注意: 显著节省成本的提示缓存目前仅在使用 Anthropic Claude 时可用。OpenAI 和本地提供商仅使用内存响应缓存。

智能模型选择

使用 Anthropic 作为 LLM 提供商时,Kosmos 会根据任务复杂度智能选择 Claude 模型:

  • Claude Sonnet 4.5: 复杂推理、假设生成、分析
  • Claude Haiku 4: 简单任务、数据提取、格式化

这将成本降低 15-20%,同时保持质量。

注意: 此功能特定于 Anthropic Claude。

项目结构

kosmos/
├── core/              # 核心基础设施(LLM、配置、日志)
├── agents/            # 代理实现
├── db/                # 数据库模型和操作
├── execution/         # 实验执行引擎
├── analysis/          # 结果分析和可视化
├── hypothesis/        # 假设生成和管理
├── experiments/       # 实验模板
├── literature/        # 文献搜索和分析
├── knowledge/         # 知识图谱和语义搜索
├── domains/           # 领域特定工具(生物学、物理学等)
├── safety/            # 安全检查和验证
└── cli/               # 命令行接口

tests/
├── unit/              # 单元测试
├── integration/       # 集成测试
└── e2e/               # 端到端测试

docs/
├── kosmos-figures-analysis.md      # kosmos-figures 的分析模式
├── integration-plan.md             # 集成策略
└── domain-roadmaps/                # 领域特定指南

开发测试

# 安装开发依赖
pip install -e ".[dev]"

# 运行所有测试
pytest

# 运行覆盖率测试
pytest --cov=kosmos --cov-report=html

# 运行特定测试套件
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/

# 代码格式化
black kosmos/ tests/

# 代码检查
ruff check kosmos/ tests/

# 类型检查
mypy kosmos/

开发路线图

✅ 已完成(10个阶段)

第1阶段:项目基础 ✅

  • 项目结构
  • Claude 集成(API + CLI)
  • 配置系统
  • 代理框架
  • 数据库设置

第2阶段:文献能力 ✅

  • 文献 API(arXiv、Semantic Scholar、PubMed)
  • 文献分析代理
  • 语义搜索向量数据库
  • 知识图谱

第3阶段:假设生成 ✅

  • 假设生成器代理
  • 新颖性检查
  • 假设优先级排序

第4阶段:实验设计 ✅

  • 实验设计器代理
  • 协议模板
  • 资源估算

第5阶段:实验执行 ✅

  • 沙箱执行环境
  • 集成 kosmos-figures 模式
  • 统计分析

第6阶段:结果分析 ✅

  • 数据分析代理
  • 可视化生成
  • 结果摘要

第7阶段:研究编排 ✅

  • 研究主管代理
  • 反馈循环
  • 收敛检测

第8阶段:安全与验证 ✅

  • 安全验证
  • 领域特定工具

第9阶段:生产部署 ✅

  • 性能优化(20-40× 提升)
  • 多层缓存系统
  • 综合测试(90%+ 覆盖率)

第10阶段:文档与完善 ✅

  • 丰富的文档(10,000+ 行)
  • 用户指南
  • API 文档
  • 示例代码

科学发现案例

Kosmos 已在多个领域产生了经过验证的科学发现:

1. 代谢组学 - 脑低温保护

独立复现了未发表手稿中的发现,识别出核苷酸代谢是低温小鼠脑中的主要改变途径。

2. 材料科学 - 太阳能电池效率

发现热处理期间的湿度是太阳能电池效率的关键决定因素,并识别出临界湿度阈值。

3. 神经科学 - 神经网络连接

展示了跨物种的脑网络遵循对数正态模式,而非幂律模式。

4. 心脏疾病 - SOD2 保护因子

发现 SOD2 蛋白似乎通过减少纤维化来保护心脏。

5. 糖尿病 - SSR1 基因变异

发现 SSR1 基因附近的遗传变异可能对2型糖尿病具有保护作用。

6. 阿尔茨海默病 - 时序分析方法

提出了一种追踪疾病脑细胞中蛋白质随时间变化的新分析技术。

7. 神经退行性疾病 - 磷脂酰丝氨酸暴露

识别出神经元因年龄相关的翻转酶表达丧失而暴露"吞噬我"信号。

研究效率: 独立科学家发现 Kosmos 报告中 79.4% 的陈述是准确的,合作者报告单次20循环 Kosmos 运行平均相当于他们自己 6 个月的研究时间。

灵感来源

本项目受以下工作启发:

贡献指南

欢迎贡献!请参见 CONTRIBUTING.md 了解指南。

欢迎的贡献领域:

  • 领域特定工具和 API
  • 不同领域的实验模板
  • 文献 API 集成
  • 安全验证
  • 文档
  • 测试

许可证

MIT License - 详见 LICENSE

引用

如果你在研究中使用 Kosmos,请引用:

@software{kosmos_ai_scientist,
  title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
  author={Kosmos Contributors},
  year={2025},
  url={https://github.com/jimmc414/Kosmos}
}

致谢

  • Anthropic 提供 Claude 和 Claude Code
  • Edison Scientific 提供 kosmos-figures 分析模式
  • 开放科学社区提供文献 API 和工具

支持与社区

项目状态

状态: 生产就绪 (v0.2.0) - 所有10个开发阶段完成

最后更新: 2025-11-07


文档资源

核心优势总结

  1. 完全自主: 从假设到发现的端到端自动化
  2. 多领域支持: 跨生物学、物理学、化学等多个领域
  3. 经过验证: 已产生7项经过验证的科学发现
  4. 成本优化: 多层缓存降低30-40%成本
  5. 灵活集成: 支持 API 和 CLI 两种方式
  6. 安全可靠: 沙箱执行、验证机制、90%+测试覆盖率
  7. 生产就绪: v0.2.0 版本,所有开发阶段完成

Star History Chart