jimmc414/Kosmos View GitHub Homepage for Latest Official Releases

基于 Claude 驱动的开源自主 AI 科学家,能够自动执行完整的科学研究循环:文献分析、假设生成、实验设计、执行分析和迭代改进

PythonKosmosjimmc414 413 Last Updated: January 26, 2026

Kosmos - 自主AI科学家平台详细介绍

项目概述

Kosmos 是一个开源的自主AI科学家实现,能够执行完整的科学研究循环:从文献分析和假设生成,到实验设计、执行、分析和迭代改进。该项目基于 2025年11月发布的 Kosmos AI 论文(https://arxiv.org/abs/2511.02824),并适配为可由 Claude Code 或 Anthropic API 驱动的实现。

核心特性

🔬 自主研究循环

端到端科学工作流: 完整的研究周期自动化
多领域支持: 生物学、物理学、化学、神经科学、材料科学
迭代改进: 基于结果自动优化假设和实验设计

🤖 AI驱动的智能系统

Claude Sonnet 4 驱动: 用于假设生成和高级分析
多模型支持: 支持 Anthropic Claude、OpenAI GPT 和本地模型(Ollama、LM Studio)
智能模型选择: 根据任务复杂度自动选择最优模型

🔧 灵活的集成方式

双重集成选项:
- 选项A: Anthropic API(按使用付费)
- 选项B: Claude Code CLI(需要 Max 订阅)
成熟的分析模式: 集成来自 kosmos-figures 的经过实战验证的统计方法

📚 文献集成

自动化论文搜索: 支持 arXiv、Semantic Scholar、PubMed
文献摘要: 自动提取关键信息
新颖性检查: 验证研究假设的创新性

🏗️ 代理架构

模块化设计: 每个研究任务对应独立的代理
并行执行: 同时运行多个研究任务
协同工作: 代理间通过结构化世界模型共享信息

🛡️ 安全优先

沙箱执行: 隔离的代码运行环境
验证机制: 结果验证和可复现性检查
人工审批门: 可选的人工审核环节

💰 成本优化

多层缓存系统: 降低 30-40% 的 API 成本
智能提示缓存: 使用 Anthropic 时显著节省成本
模型选择优化: 根据任务复杂度智能选择模型,降低 15-20% 成本

系统架构

核心组件

┌─────────────────────────────────────────────────────────────┐
│                    Research Director                         │
│              (协调自主研究循环的主控制器)                      │
└──────────────┬──────────────────────────────────────────────┘
               │
┌──────────────┴────────┬───────────────┬──────────────┐
│                       │               │              │
┌───▼────┐   ┌─────────▼──────────┐  ┌▼──────────┐ ┌▼─────────────┐
│Literature│  │Hypothesis Generator│  │Experiment │ │Data Analyst  │
│Analyzer  │  │     (Claude)       │  │Designer   │ │   (Claude)   │
└───┬────┘   └─────────┬──────────┘  └┬──────────┘ └┬─────────────┘
    │                  │               │             │
    └──────────────────┴───────────────┴─────────────┘
                       │
            ┌──────────▼──────────┐
            │  Execution Engine   │
            │   (kosmos-figures   │
            │   proven patterns)  │
            └─────────────────────┘

代理说明

Research Director (研究主管): 管理研究工作流的主协调器
Literature Analyzer (文献分析器): 搜索和分析科学论文(arXiv、Semantic Scholar、PubMed)
Hypothesis Generator (假设生成器): 使用 Claude 生成可测试的假设
Experiment Designer (实验设计器): 设计计算实验
Execution Engine (执行引擎): 使用经过验证的统计方法运行实验
Data Analyst (数据分析器): 使用 Claude 解释结果
Feedback Loop (反馈循环): 基于结果迭代改进假设

技术要求

基础要求

Python 3.11 或 3.12
以下之一:
- 选项A: Anthropic API 密钥(按使用付费)
- 选项B: Claude Code CLI 已安装(需要 Max 订阅)

安装指南

基础安装

# 克隆仓库
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos

# 创建虚拟环境
python3.11 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# 安装依赖
pip install -e .

# 支持 Claude Code CLI (选项B)
pip install -e ".[router]"

选项A: Anthropic API 配置

# 复制示例配置
cp .env.example .env

# 编辑 .env 并设置你的 API 密钥
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here

从 console.anthropic.com 获取你的 API 密钥

优点:

按使用付费
无需 CLI 安装
可在任何地方工作

缺点:

按 token 收费
有速率限制

选项B: Claude Code CLI 配置

# 1. 安装 Claude Code CLI
# 访问 https://claude.ai/download 按照说明操作

# 2. 认证 Claude CLI
claude auth

# 3. 复制示例配置
cp .env.example .env

# 4. 编辑 .env 并将 API 密钥设置为全9(触发 CLI 路由)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999

这会将所有 API 调用路由到本地 Claude Code CLI,使用你的 Max 订阅,无需按 token 付费。

优点:

无按 token 成本
无限使用
最新的 Claude 模型
本地执行

缺点:

需要 Claude CLI 安装
需要 Max 订阅

数据库初始化

# 运行数据库迁移
alembic upgrade head

# 验证数据库已创建
ls -la kosmos.db

快速开始

基础使用示例

from kosmos import ResearchDirector

# 初始化研究主管
director = ResearchDirector()

# 提出研究问题
question = "睡眠剥夺与记忆巩固之间的关系是什么?"

# 运行自主研究
results = director.conduct_research(
    question=question,
    domain="neuroscience",
    max_iterations=5
)

# 查看结果
print(results.summary)
print(results.key_findings)

配置选项

所有配置通过环境变量进行(参见 .env.example):

核心配置

ANTHROPIC_API_KEY: API 密钥或 999... 用于 CLI 模式
CLAUDE_MODEL: 要使用的模型(仅 API 模式)
DATABASE_URL: 数据库连接字符串
LOG_LEVEL: 日志详细程度

研究配置

MAX_RESEARCH_ITERATIONS: 最大自主迭代次数
ENABLED_DOMAINS: 支持哪些科学领域
ENABLED_EXPERIMENT_TYPES: 允许的实验类型
MIN_NOVELTY_SCORE: 最小新颖性阈值

安全配置

ENABLE_SAFETY_CHECKS: 代码安全验证
MAX_EXPERIMENT_EXECUTION_TIME: 实验超时时间
ENABLE_SANDBOXING: 沙箱代码执行
REQUIRE_HUMAN_APPROVAL: 人工审批门

性能优化

缓存系统

Kosmos 包含多层缓存系统,可降低 30-40% 的 API 成本:

# 查看缓存性能
kosmos cache --stats

# 示例输出:
# 总体缓存性能:
# 总请求数: 500
# 缓存命中: 175 (35%)
# 估计节省成本: $15.75

注意: 显著节省成本的提示缓存目前仅在使用 Anthropic Claude 时可用。OpenAI 和本地提供商仅使用内存响应缓存。

智能模型选择

使用 Anthropic 作为 LLM 提供商时,Kosmos 会根据任务复杂度智能选择 Claude 模型:

Claude Sonnet 4.5: 复杂推理、假设生成、分析
Claude Haiku 4: 简单任务、数据提取、格式化

这将成本降低 15-20%,同时保持质量。

注意: 此功能特定于 Anthropic Claude。

项目结构

kosmos/
├── core/              # 核心基础设施(LLM、配置、日志)
├── agents/            # 代理实现
├── db/                # 数据库模型和操作
├── execution/         # 实验执行引擎
├── analysis/          # 结果分析和可视化
├── hypothesis/        # 假设生成和管理
├── experiments/       # 实验模板
├── literature/        # 文献搜索和分析
├── knowledge/         # 知识图谱和语义搜索
├── domains/           # 领域特定工具(生物学、物理学等)
├── safety/            # 安全检查和验证
└── cli/               # 命令行接口

tests/
├── unit/              # 单元测试
├── integration/       # 集成测试
└── e2e/               # 端到端测试

docs/
├── kosmos-figures-analysis.md      # kosmos-figures 的分析模式
├── integration-plan.md             # 集成策略
└── domain-roadmaps/                # 领域特定指南

开发测试

# 安装开发依赖
pip install -e ".[dev]"

# 运行所有测试
pytest

# 运行覆盖率测试
pytest --cov=kosmos --cov-report=html

# 运行特定测试套件
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/

# 代码格式化
black kosmos/ tests/

# 代码检查
ruff check kosmos/ tests/

# 类型检查
mypy kosmos/

开发路线图

✅ 已完成(10个阶段)

第1阶段:项目基础 ✅

项目结构
Claude 集成(API + CLI)
配置系统
代理框架
数据库设置

第2阶段:文献能力 ✅

文献 API(arXiv、Semantic Scholar、PubMed)
文献分析代理
语义搜索向量数据库
知识图谱

第3阶段:假设生成 ✅

假设生成器代理
新颖性检查
假设优先级排序

第4阶段:实验设计 ✅

实验设计器代理
协议模板
资源估算

第5阶段:实验执行 ✅

沙箱执行环境
集成 kosmos-figures 模式
统计分析

第6阶段:结果分析 ✅

数据分析代理
可视化生成
结果摘要

第7阶段:研究编排 ✅

研究主管代理
反馈循环
收敛检测

第8阶段:安全与验证 ✅

安全验证
领域特定工具

第9阶段:生产部署 ✅

性能优化(20-40× 提升)
多层缓存系统
综合测试(90%+ 覆盖率)

第10阶段:文档与完善 ✅

丰富的文档(10,000+ 行)
用户指南
API 文档
示例代码

科学发现案例

Kosmos 已在多个领域产生了经过验证的科学发现:

1. 代谢组学 - 脑低温保护

独立复现了未发表手稿中的发现,识别出核苷酸代谢是低温小鼠脑中的主要改变途径。

2. 材料科学 - 太阳能电池效率

发现热处理期间的湿度是太阳能电池效率的关键决定因素,并识别出临界湿度阈值。

3. 神经科学 - 神经网络连接

展示了跨物种的脑网络遵循对数正态模式,而非幂律模式。

4. 心脏疾病 - SOD2 保护因子

发现 SOD2 蛋白似乎通过减少纤维化来保护心脏。

5. 糖尿病 - SSR1 基因变异

发现 SSR1 基因附近的遗传变异可能对2型糖尿病具有保护作用。

6. 阿尔茨海默病 - 时序分析方法

提出了一种追踪疾病脑细胞中蛋白质随时间变化的新分析技术。

7. 神经退行性疾病 - 磷脂酰丝氨酸暴露

识别出神经元因年龄相关的翻转酶表达丧失而暴露"吞噬我"信号。

研究效率: 独立科学家发现 Kosmos 报告中 79.4% 的陈述是准确的,合作者报告单次20循环 Kosmos 运行平均相当于他们自己 6 个月的研究时间。

灵感来源

本项目受以下工作启发:

论文: Kosmos: An AI Scientist for Autonomous Discovery (2025年11月)
分析模式: kosmos-figures 仓库
Claude Router: claude_n_codex_api_proxy

贡献指南

欢迎贡献!请参见 CONTRIBUTING.md 了解指南。

欢迎的贡献领域:

领域特定工具和 API
不同领域的实验模板
文献 API 集成
安全验证
文档
测试

许可证

MIT License - 详见 LICENSE

引用

如果你在研究中使用 Kosmos,请引用:

@software{kosmos_ai_scientist,
  title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
  author={Kosmos Contributors},
  year={2025},
  url={https://github.com/jimmc414/Kosmos}
}

致谢

Anthropic 提供 Claude 和 Claude Code
Edison Scientific 提供 kosmos-figures 分析模式
开放科学社区提供文献 API 和工具

支持与社区

Issues: GitHub Issues
讨论: GitHub Discussions

项目状态

状态: 生产就绪 (v0.2.0) - 所有10个开发阶段完成

最后更新: 2025-11-07

文档资源

架构概述 - 系统设计和组件
集成计划 - kosmos-figures 模式集成方式
领域路线图 - 领域特定实现指南
API 参考 - API 文档
贡献指南 - 如何贡献

核心优势总结

完全自主: 从假设到发现的端到端自动化
多领域支持: 跨生物学、物理学、化学等多个领域
经过验证: 已产生7项经过验证的科学发现
成本优化: 多层缓存降低30-40%成本
灵活集成: 支持 API 和 CLI 两种方式
安全可靠: 沙箱执行、验证机制、90%+测试覆盖率
生产就绪: v0.2.0 版本,所有开发阶段完成