jimmc414/Kosmos View GitHub Homepage for Latest Official Releases

基於 Claude 驅動的開源自主 AI 科學家，能夠自動執行完整的科學研究循環：文獻分析、假設生成、實驗設計、執行分析和迭代改進

PythonKosmosjimmc414 413 Last Updated: January 26, 2026

Kosmos - 自主AI科學家平台詳細介紹

項目概述

Kosmos 是一個開源的自主AI科學家實現，能夠執行完整的科學研究循環：從文獻分析和假設生成，到實驗設計、執行、分析和迭代改進。該項目基於 2025年11月發布的 Kosmos AI 論文 (https://arxiv.org/abs/2511.02824)，並適配為可由 Claude Code 或 Anthropic API 驅動的實現。

核心特性

🔬 自主研究循環

端到端科學工作流：完整的研究週期自動化
多領域支持：生物學、物理學、化學、神經科學、材料科學
迭代改進：基於結果自動優化假設和實驗設計

🤖 AI驅動的智能系統

Claude Sonnet 4 驅動：用於假設生成和高級分析
多模型支持：支持 Anthropic Claude、OpenAI GPT 和本地模型 (Ollama、LM Studio)
智能模型選擇：根據任務複雜度自動選擇最優模型

🔧 靈活的集成方式

雙重集成選項：
- 選項A：Anthropic API（按使用付費）
- 選項B：Claude Code CLI（需要 Max 訂閱）
成熟的分析模式：集成來自 kosmos-figures 的經過實戰驗證的統計方法

📚 文獻集成

自動化論文搜索：支持 arXiv、Semantic Scholar、PubMed
文獻摘要：自動提取關鍵信息
新穎性檢查：驗證研究假設的創新性

🏗️ 代理架構

模塊化設計：每個研究任務對應獨立的代理
並行執行：同時運行多個研究任務
協同工作：代理間通過結構化世界模型共享信息

🛡️ 安全優先

沙箱執行：隔離的代碼運行環境
驗證機制：結果驗證和可復現性檢查
人工審批門：可選的人工審核環節

💰 成本優化

多層緩存系統：降低 30-40% 的 API 成本
智能提示緩存：使用 Anthropic 時顯著節省成本
模型選擇優化：根據任務複雜度智能選擇模型，降低 15-20% 成本

系統架構

核心組件

┌─────────────────────────────────────────────────────────────┐
│                    Research Director                         │
│              (協調自主研究循環的主控制器)                      │
└──────────────┬──────────────────────────────────────────────┘
               │
┌──────────────┴────────┬───────────────┬──────────────┐
│                       │               │              │
┌───▼────┐   ┌─────────▼──────────┐  ┌▼──────────┐ ┌▼─────────────┐
│Literature│  │Hypothesis Generator│  │Experiment │ │Data Analyst  │
│Analyzer  │  │     (Claude)       │  │Designer   │ │   (Claude)   │
└───┬────┘   └─────────┬──────────┘  └┬──────────┘ └┬─────────────┘
    │                  │               │             │
    └──────────────────┴───────────────┴─────────────┘
                       │
            ┌──────────▼──────────┐
            │  Execution Engine   │
            │   (kosmos-figures   │
            │   proven patterns)  │
            └─────────────────────┘

代理說明

Research Director (研究主管)：管理研究工作流的主協調器
Literature Analyzer (文獻分析器)：搜索和分析科學論文 (arXiv、Semantic Scholar、PubMed)
Hypothesis Generator (假設生成器)：使用 Claude 生成可測試的假設
Experiment Designer (實驗设计器)：設計計算實驗
Execution Engine (執行引擎)：使用經過驗證的統計方法運行實驗
Data Analyst (數據分析器)：使用 Claude 解釋結果
Feedback Loop (反饋循環)：基於結果迭代改進假設

技術要求

基礎要求

Python 3.11 或 3.12
以下之一：
- 選項A：Anthropic API 密鑰（按使用付費）
- 選項B：Claude Code CLI 已安裝（需要 Max 訂閱）

安裝指南

基礎安裝

# 克隆倉庫
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos

# 創建虛擬環境
python3.11 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# 安裝依賴
pip install -e .

# 支持 Claude Code CLI (選項B)
pip install -e ".[router]"

選項A: Anthropic API 配置

# 複製示例配置
cp .env.example .env

# 編輯 .env 並設置你的 API 密鑰
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here

從 console.anthropic.com 獲取你的 API 密鑰

優點:

按使用付費
無需 CLI 安裝
可在任何地方工作

缺點:

按 token 收費
有速率限制

選項B: Claude Code CLI 配置

# 1. 安裝 Claude Code CLI
# 訪問 https://claude.ai/download 按照說明操作

# 2. 認證 Claude CLI
claude auth

# 3. 複製示例配置
cp .env.example .env

# 4. 編輯 .env 並將 API 密鑰設置為全9（觸發 CLI 路由）
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999

這會將所有 API 調用路由到本地 Claude Code CLI，使用你的 Max 訂閱，無需按 token 付費。

優點:

無按 token 成本
無限使用
最新的 Claude 模型
本地執行

缺點:

需要 Claude CLI 安裝
需要 Max 訂閱

數據庫初始化

# 運行數據庫遷移
alembic upgrade head

# 驗證數據庫已創建
ls -la kosmos.db

快速開始

基礎使用示例

from kosmos import ResearchDirector

# 初始化研究主管
director = ResearchDirector()

# 提出研究問題
question = "睡眠剝奪與記憶鞏固之間的關係是什麼?"

# 運行自主研究
results = director.conduct_research(
    question=question,
    domain="neuroscience",
    max_iterations=5
)

# 查看結果
print(results.summary)
print(results.key_findings)

配置選項

所有配置通過環境變量進行（參見 .env.example）：

核心配置

ANTHROPIC_API_KEY：API 密鑰或 999... 用於 CLI 模式
CLAUDE_MODEL：要使用的模型（僅 API 模式）
DATABASE_URL：數據庫連接字符串
LOG_LEVEL：日誌詳細程度

研究配置

MAX_RESEARCH_ITERATIONS：最大自主迭代次數
ENABLED_DOMAINS：支持哪些科學領域
ENABLED_EXPERIMENT_TYPES：允許的實驗類型
MIN_NOVELTY_SCORE：最小新穎性閾值

安全配置

ENABLE_SAFETY_CHECKS：代碼安全驗證
MAX_EXPERIMENT_EXECUTION_TIME：實驗超時時間
ENABLE_SANDBOXING：沙箱代碼執行
REQUIRE_HUMAN_APPROVAL：人工審批門

性能優化

緩存系統

Kosmos 包含多層緩存系統，可降低 30-40% 的 API 成本：

# 查看緩存性能
kosmos cache --stats

# 示例輸出：
# 總體緩存性能：
# 總請求数：500
# 緩存命中：175 (35%)
# 估計節省成本：$15.75

注意：顯著節省成本的提示緩存目前僅在使用 Anthropic Claude 時可用。OpenAI 和本地提供商僅使用內存響應緩存。

智能模型選擇

使用 Anthropic 作為 LLM 提供商時，Kosmos 會根據任務複雜度智能選擇 Claude 模型：

Claude Sonnet 4.5：複雜推理、假設生成、分析
Claude Haiku 4：簡單任務、數據提取、格式化

這將成本降低 15-20%，同時保持質量。

注意：此功能特定於 Anthropic Claude。

項目結構

kosmos/
├── core/              # 核心基礎設施 (LLM、配置、日誌)
├── agents/            # 代理實現
├── db/                # 數據庫模型和操作
├── execution/         # 實驗執行引擎
├── analysis/          # 結果分析和可視化
├── hypothesis/        # 假設生成和管理
├── experiments/       # 實驗模板
├── literature/        # 文獻搜索和分析
├── knowledge/         # 知識圖譜和語義搜索
├── domains/           # 領域特定工具 (生物學、物理學等)
├── safety/            # 安全檢查和驗證
└── cli/               # 命令行接口

tests/
├── unit/              # 單元測試
├── integration/       # 集成測試
└── e2e/               # 端到端測試

docs/
├── kosmos-figures-analysis.md      # kosmos-figures 的分析模式
├── integration-plan.md             # 集成策略
└── domain-roadmaps/                # 領域特定指南

開發測試

# 安裝開發依賴
pip install -e ".[dev]"

# 運行所有測試
pytest

# 運行覆蓋率測試
pytest --cov=kosmos --cov-report=html

# 運行特定測試套件
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/

# 代碼格式化
black kosmos/ tests/

# 代碼檢查
ruff check kosmos/ tests/

# 類型檢查
mypy kosmos/

開發路線圖

✅ 已完成（10個階段）

第1階段:項目基礎 ✅

項目結構
Claude 集成 (API + CLI)
配置系統
代理框架
數據庫設置

第2階段:文獻能力 ✅

文獻 API (arXiv、Semantic Scholar、PubMed)
文獻分析代理
語義搜索向量數據庫
知識圖譜

第3階段:假設生成 ✅

假設生成器代理
新穎性檢查
假設優先級排序

第4階段:實驗設計 ✅

實驗设计器代理
協議模板
資源估算

第5階段:實驗執行 ✅

沙箱執行環境
集成 kosmos-figures 模式
統計分析

第6階段:結果分析 ✅

數據分析代理
可視化生成
結果摘要

第7階段:研究編排 ✅

研究主管代理
反饋循環
收斂檢測

第8階段:安全與驗證 ✅

安全驗證
領域特定工具

第9階段:生產部署 ✅

性能優化 (20-40× 提升)
多層緩存系統
綜合測試 (90%+ 覆蓋率)

第10階段:文檔與完善 ✅

豐富的文檔 (10,000+ 行)
用戶指南
API 文檔
示例代碼

科學發現案例

Kosmos 已在多個領域產生了經過驗證的科學發現：

1. 代謝組學 - 腦低溫保護

獨立復現了未發表手稿中的發現，識別出核苷酸代謝是低溫小鼠腦中的主要改變途徑。

2. 材料科學 - 太陽能電池效率

發現熱處理期間的濕度是太陽能電池效率的關鍵決定因素，並識別出臨界濕度閾值。

3. 神經科學 - 神經網絡連接

展示了跨物種的大腦網絡遵循對數正態模式，而非冪律模式。

4. 心臟疾病 - SOD2 保護因子

發現 SOD2 蛋白似乎通過減少纖維化來保護心臟。

5. 糖尿病 - SSR1 基因變異

發現 SSR1 基因附近的遺傳變異可能對2型糖尿病具有保護作用。

6. 阿爾茨海默病 - 時序分析方法

提出了一種追蹤疾病腦細胞中蛋白質隨時間變化的新分析技術。

7. 神經退行性疾病 - 磷脂酰絲氨酸暴露

識別出神經元因年齡相關的翻轉酶表達喪失而暴露“吞噬我”信號。

研究效率：獨立科學家發現 Kosmos 報告中 79.4% 的陳述是準確的，合作夥伴報告單次 20 循環 Kosmos 運行平均相當於他們自己 6 個月的研究時間。

靈感來源

本項目受以下工作啟發：

論文：Kosmos: An AI Scientist for Autonomous Discovery (2025年11月)
分析模式：kosmos-figures 仓库
Claude Router：claude_n_codex_api_proxy

貢獻指南

歡迎貢獻！請參見 CONTRIBUTING.md 了解指南。

歡迎的貢獻領域：

領域特定工具和 API
不同領域的實驗模板
文獻 API 集成
安全驗證
文檔
測試

授權

MIT License - 詳見 LICENSE

引用

如果你在研究中使用 Kosmos，請引用：

@software{kosmos_ai_scientist,
  title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
  author={Kosmos Contributors},
  year={2025},
  url={https://github.com/jimmc414/Kosmos}
}

致謝

Anthropic 提供 Claude 和 Claude Code
Edison Scientific 提供 kosmos-figures 分析模式
開放科學社區提供文獻 API 和工具

支持與社區

Issues：GitHub Issues
討論：GitHub Discussions

項目狀態

狀態：生產就緒 (v0.2.0) - 所有 10 個開發階段完成

最後更新：2025-11-07

文檔資源

架構概述 - 系統設計和組件
集成計劃 - kosmos-figures 模式集成方式
領域路線圖 - 領域特定實現指南
API 參考 - API 文檔
貢獻指南 - 如何貢獻

核心優勢總結

完全自主：從假設到發現的端到端自動化
多領域支持：跨生物學、物理學、化學等多個領域
經過驗證：已產生 7 項經過驗證的科學發現
成本優化：多層緩存降低 30-40% 成本
靈活集成：支持 API 和 CLI 兩種方式
安全可靠：沙箱執行、驗證機制、90%+ 測試覆蓋率
生產就緒：v0.2.0 版本，所有開發階段完成