基於 Claude 驅動的開源自主 AI 科學家,能夠自動執行完整的科學研究循環:文獻分析、假設生成、實驗設計、執行分析和迭代改進

PythonKosmosjimmc414 308 Last Updated: December 12, 2025

Kosmos - 自主AI科學家平台詳細介紹

項目概述

Kosmos 是一個開源的自主AI科學家實現,能夠執行完整的科學研究循環:從文獻分析和假設生成,到實驗設計、執行、分析和迭代改進。該項目基於 2025年11月發布的 Kosmos AI 論文 (https://arxiv.org/abs/2511.02824),並適配為可由 Claude Code 或 Anthropic API 驅動的實現。

核心特性

🔬 自主研究循環

  • 端到端科學工作流:完整的研究週期自動化
  • 多領域支持:生物學、物理學、化學、神經科學、材料科學
  • 迭代改進:基於結果自動優化假設和實驗設計

🤖 AI驅動的智能系統

  • Claude Sonnet 4 驅動:用於假設生成和高級分析
  • 多模型支持:支持 Anthropic Claude、OpenAI GPT 和本地模型 (Ollama、LM Studio)
  • 智能模型選擇:根據任務複雜度自動選擇最優模型

🔧 靈活的集成方式

  • 雙重集成選項
    • 選項A:Anthropic API(按使用付費)
    • 選項B:Claude Code CLI(需要 Max 訂閱)
  • 成熟的分析模式:集成來自 kosmos-figures 的經過實戰驗證的統計方法

📚 文獻集成

  • 自動化論文搜索:支持 arXiv、Semantic Scholar、PubMed
  • 文獻摘要:自動提取關鍵信息
  • 新穎性檢查:驗證研究假設的創新性

🏗️ 代理架構

  • 模塊化設計:每個研究任務對應獨立的代理
  • 並行執行:同時運行多個研究任務
  • 協同工作:代理間通過結構化世界模型共享信息

🛡️ 安全優先

  • 沙箱執行:隔離的代碼運行環境
  • 驗證機制:結果驗證和可復現性檢查
  • 人工審批門:可選的人工審核環節

💰 成本優化

  • 多層緩存系統:降低 30-40% 的 API 成本
  • 智能提示緩存:使用 Anthropic 時顯著節省成本
  • 模型選擇優化:根據任務複雜度智能選擇模型,降低 15-20% 成本

系統架構

核心組件

┌─────────────────────────────────────────────────────────────┐
│                    Research Director                         │
│              (協調自主研究循環的主控制器)                      │
└──────────────┬──────────────────────────────────────────────┘
               │
┌──────────────┴────────┬───────────────┬──────────────┐
│                       │               │              │
┌───▼────┐   ┌─────────▼──────────┐  ┌▼──────────┐ ┌▼─────────────┐
│Literature│  │Hypothesis Generator│  │Experiment │ │Data Analyst  │
│Analyzer  │  │     (Claude)       │  │Designer   │ │   (Claude)   │
└───┬────┘   └─────────┬──────────┘  └┬──────────┘ └┬─────────────┘
    │                  │               │             │
    └──────────────────┴───────────────┴─────────────┘
                       │
            ┌──────────▼──────────┐
            │  Execution Engine   │
            │   (kosmos-figures   │
            │   proven patterns)  │
            └─────────────────────┘

代理說明

  • Research Director (研究主管):管理研究工作流的主協調器
  • Literature Analyzer (文獻分析器):搜索和分析科學論文 (arXiv、Semantic Scholar、PubMed)
  • Hypothesis Generator (假設生成器):使用 Claude 生成可測試的假設
  • Experiment Designer (實驗设计器):設計計算實驗
  • Execution Engine (執行引擎):使用經過驗證的統計方法運行實驗
  • Data Analyst (數據分析器):使用 Claude 解釋結果
  • Feedback Loop (反饋循環):基於結果迭代改進假設

技術要求

基礎要求

  • Python 3.11 或 3.12
  • 以下之一:
    • 選項A:Anthropic API 密鑰(按使用付費)
    • 選項B:Claude Code CLI 已安裝(需要 Max 訂閱)

安裝指南

基礎安裝

# 克隆倉庫
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos

# 創建虛擬環境
python3.11 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# 安裝依賴
pip install -e .

# 支持 Claude Code CLI (選項B)
pip install -e ".[router]"

選項A: Anthropic API 配置

# 複製示例配置
cp .env.example .env

# 編輯 .env 並設置你的 API 密鑰
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here

console.anthropic.com 獲取你的 API 密鑰

優點:

  • 按使用付費
  • 無需 CLI 安裝
  • 可在任何地方工作

缺點:

  • 按 token 收費
  • 有速率限制

選項B: Claude Code CLI 配置

# 1. 安裝 Claude Code CLI
# 訪問 https://claude.ai/download 按照說明操作

# 2. 認證 Claude CLI
claude auth

# 3. 複製示例配置
cp .env.example .env

# 4. 編輯 .env 並將 API 密鑰設置為全9(觸發 CLI 路由)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999

這會將所有 API 調用路由到本地 Claude Code CLI,使用你的 Max 訂閱,無需按 token 付費。

優點:

  • 無按 token 成本
  • 無限使用
  • 最新的 Claude 模型
  • 本地執行

缺點:

  • 需要 Claude CLI 安裝
  • 需要 Max 訂閱

數據庫初始化

# 運行數據庫遷移
alembic upgrade head

# 驗證數據庫已創建
ls -la kosmos.db

快速開始

基礎使用示例

from kosmos import ResearchDirector

# 初始化研究主管
director = ResearchDirector()

# 提出研究問題
question = "睡眠剝奪與記憶鞏固之間的關係是什麼?"

# 運行自主研究
results = director.conduct_research(
    question=question,
    domain="neuroscience",
    max_iterations=5
)

# 查看結果
print(results.summary)
print(results.key_findings)

配置選項

所有配置通過環境變量進行(參見 .env.example):

核心配置

  • ANTHROPIC_API_KEY:API 密鑰或 999... 用於 CLI 模式
  • CLAUDE_MODEL:要使用的模型(僅 API 模式)
  • DATABASE_URL:數據庫連接字符串
  • LOG_LEVEL:日誌詳細程度

研究配置

  • MAX_RESEARCH_ITERATIONS:最大自主迭代次數
  • ENABLED_DOMAINS:支持哪些科學領域
  • ENABLED_EXPERIMENT_TYPES:允許的實驗類型
  • MIN_NOVELTY_SCORE:最小新穎性閾值

安全配置

  • ENABLE_SAFETY_CHECKS:代碼安全驗證
  • MAX_EXPERIMENT_EXECUTION_TIME:實驗超時時間
  • ENABLE_SANDBOXING:沙箱代碼執行
  • REQUIRE_HUMAN_APPROVAL:人工審批門

性能優化

緩存系統

Kosmos 包含多層緩存系統,可降低 30-40% 的 API 成本:

# 查看緩存性能
kosmos cache --stats

# 示例輸出:
# 總體緩存性能:
# 總請求数:500
# 緩存命中:175 (35%)
# 估計節省成本:$15.75

注意:顯著節省成本的提示緩存目前僅在使用 Anthropic Claude 時可用。OpenAI 和本地提供商僅使用內存響應緩存。

智能模型選擇

使用 Anthropic 作為 LLM 提供商時,Kosmos 會根據任務複雜度智能選擇 Claude 模型:

  • Claude Sonnet 4.5:複雜推理、假設生成、分析
  • Claude Haiku 4:簡單任務、數據提取、格式化

這將成本降低 15-20%,同時保持質量。

注意:此功能特定於 Anthropic Claude。

項目結構

kosmos/
├── core/              # 核心基礎設施 (LLM、配置、日誌)
├── agents/            # 代理實現
├── db/                # 數據庫模型和操作
├── execution/         # 實驗執行引擎
├── analysis/          # 結果分析和可視化
├── hypothesis/        # 假設生成和管理
├── experiments/       # 實驗模板
├── literature/        # 文獻搜索和分析
├── knowledge/         # 知識圖譜和語義搜索
├── domains/           # 領域特定工具 (生物學、物理學等)
├── safety/            # 安全檢查和驗證
└── cli/               # 命令行接口

tests/
├── unit/              # 單元測試
├── integration/       # 集成測試
└── e2e/               # 端到端測試

docs/
├── kosmos-figures-analysis.md      # kosmos-figures 的分析模式
├── integration-plan.md             # 集成策略
└── domain-roadmaps/                # 領域特定指南

開發測試

# 安裝開發依賴
pip install -e ".[dev]"

# 運行所有測試
pytest

# 運行覆蓋率測試
pytest --cov=kosmos --cov-report=html

# 運行特定測試套件
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/

# 代碼格式化
black kosmos/ tests/

# 代碼檢查
ruff check kosmos/ tests/

# 類型檢查
mypy kosmos/

開發路線圖

✅ 已完成(10個階段)

第1階段:項目基礎 ✅

  • 項目結構
  • Claude 集成 (API + CLI)
  • 配置系統
  • 代理框架
  • 數據庫設置

第2階段:文獻能力 ✅

  • 文獻 API (arXiv、Semantic Scholar、PubMed)
  • 文獻分析代理
  • 語義搜索向量數據庫
  • 知識圖譜

第3階段:假設生成 ✅

  • 假設生成器代理
  • 新穎性檢查
  • 假設優先級排序

第4階段:實驗設計 ✅

  • 實驗设计器代理
  • 協議模板
  • 資源估算

第5階段:實驗執行 ✅

  • 沙箱執行環境
  • 集成 kosmos-figures 模式
  • 統計分析

第6階段:結果分析 ✅

  • 數據分析代理
  • 可視化生成
  • 結果摘要

第7階段:研究編排 ✅

  • 研究主管代理
  • 反饋循環
  • 收斂檢測

第8階段:安全與驗證 ✅

  • 安全驗證
  • 領域特定工具

第9階段:生產部署 ✅

  • 性能優化 (20-40× 提升)
  • 多層緩存系統
  • 綜合測試 (90%+ 覆蓋率)

第10階段:文檔與完善 ✅

  • 豐富的文檔 (10,000+ 行)
  • 用戶指南
  • API 文檔
  • 示例代碼

科學發現案例

Kosmos 已在多個領域產生了經過驗證的科學發現:

1. 代謝組學 - 腦低溫保護

獨立復現了未發表手稿中的發現,識別出核苷酸代謝是低溫小鼠腦中的主要改變途徑。

2. 材料科學 - 太陽能電池效率

發現熱處理期間的濕度是太陽能電池效率的關鍵決定因素,並識別出臨界濕度閾值。

3. 神經科學 - 神經網絡連接

展示了跨物種的大腦網絡遵循對數正態模式,而非冪律模式。

4. 心臟疾病 - SOD2 保護因子

發現 SOD2 蛋白似乎通過減少纖維化來保護心臟。

5. 糖尿病 - SSR1 基因變異

發現 SSR1 基因附近的遺傳變異可能對2型糖尿病具有保護作用。

6. 阿爾茨海默病 - 時序分析方法

提出了一種追蹤疾病腦細胞中蛋白質隨時間變化的新分析技術。

7. 神經退行性疾病 - 磷脂酰絲氨酸暴露

識別出神經元因年齡相關的翻轉酶表達喪失而暴露“吞噬我”信號。

研究效率:獨立科學家發現 Kosmos 報告中 79.4% 的陳述是準確的,合作夥伴報告單次 20 循環 Kosmos 運行平均相當於他們自己 6 個月的研究時間。

靈感來源

本項目受以下工作啟發:

貢獻指南

歡迎貢獻!請參見 CONTRIBUTING.md 了解指南。

歡迎的貢獻領域:

  • 領域特定工具和 API
  • 不同領域的實驗模板
  • 文獻 API 集成
  • 安全驗證
  • 文檔
  • 測試

授權

MIT License - 詳見 LICENSE

引用

如果你在研究中使用 Kosmos,請引用:

@software{kosmos_ai_scientist,
  title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
  author={Kosmos Contributors},
  year={2025},
  url={https://github.com/jimmc414/Kosmos}
}

致謝

  • Anthropic 提供 Claude 和 Claude Code
  • Edison Scientific 提供 kosmos-figures 分析模式
  • 開放科學社區提供文獻 API 和工具

支持與社區

項目狀態

狀態:生產就緒 (v0.2.0) - 所有 10 個開發階段完成

最後更新:2025-11-07


文檔資源

核心優勢總結

  1. 完全自主:從假設到發現的端到端自動化
  2. 多領域支持:跨生物學、物理學、化學等多個領域
  3. 經過驗證:已產生 7 項經過驗證的科學發現
  4. 成本優化:多層緩存降低 30-40% 成本
  5. 靈活集成:支持 API 和 CLI 兩種方式
  6. 安全可靠:沙箱執行、驗證機制、90%+ 測試覆蓋率
  7. 生產就緒:v0.2.0 版本,所有開發階段完成

Star History Chart