基於 Claude 驅動的開源自主 AI 科學家,能夠自動執行完整的科學研究循環:文獻分析、假設生成、實驗設計、執行分析和迭代改進
Kosmos - 自主AI科學家平台詳細介紹
項目概述
Kosmos 是一個開源的自主AI科學家實現,能夠執行完整的科學研究循環:從文獻分析和假設生成,到實驗設計、執行、分析和迭代改進。該項目基於 2025年11月發布的 Kosmos AI 論文 (https://arxiv.org/abs/2511.02824),並適配為可由 Claude Code 或 Anthropic API 驅動的實現。
核心特性
🔬 自主研究循環
- 端到端科學工作流:完整的研究週期自動化
- 多領域支持:生物學、物理學、化學、神經科學、材料科學
- 迭代改進:基於結果自動優化假設和實驗設計
🤖 AI驅動的智能系統
- Claude Sonnet 4 驅動:用於假設生成和高級分析
- 多模型支持:支持 Anthropic Claude、OpenAI GPT 和本地模型 (Ollama、LM Studio)
- 智能模型選擇:根據任務複雜度自動選擇最優模型
🔧 靈活的集成方式
- 雙重集成選項:
- 選項A:Anthropic API(按使用付費)
- 選項B:Claude Code CLI(需要 Max 訂閱)
- 成熟的分析模式:集成來自 kosmos-figures 的經過實戰驗證的統計方法
📚 文獻集成
- 自動化論文搜索:支持 arXiv、Semantic Scholar、PubMed
- 文獻摘要:自動提取關鍵信息
- 新穎性檢查:驗證研究假設的創新性
🏗️ 代理架構
- 模塊化設計:每個研究任務對應獨立的代理
- 並行執行:同時運行多個研究任務
- 協同工作:代理間通過結構化世界模型共享信息
🛡️ 安全優先
- 沙箱執行:隔離的代碼運行環境
- 驗證機制:結果驗證和可復現性檢查
- 人工審批門:可選的人工審核環節
💰 成本優化
- 多層緩存系統:降低 30-40% 的 API 成本
- 智能提示緩存:使用 Anthropic 時顯著節省成本
- 模型選擇優化:根據任務複雜度智能選擇模型,降低 15-20% 成本
系統架構
核心組件
┌─────────────────────────────────────────────────────────────┐
│ Research Director │
│ (協調自主研究循環的主控制器) │
└──────────────┬──────────────────────────────────────────────┘
│
┌──────────────┴────────┬───────────────┬──────────────┐
│ │ │ │
┌───▼────┐ ┌─────────▼──────────┐ ┌▼──────────┐ ┌▼─────────────┐
│Literature│ │Hypothesis Generator│ │Experiment │ │Data Analyst │
│Analyzer │ │ (Claude) │ │Designer │ │ (Claude) │
└───┬────┘ └─────────┬──────────┘ └┬──────────┘ └┬─────────────┘
│ │ │ │
└──────────────────┴───────────────┴─────────────┘
│
┌──────────▼──────────┐
│ Execution Engine │
│ (kosmos-figures │
│ proven patterns) │
└─────────────────────┘
代理說明
- Research Director (研究主管):管理研究工作流的主協調器
- Literature Analyzer (文獻分析器):搜索和分析科學論文 (arXiv、Semantic Scholar、PubMed)
- Hypothesis Generator (假設生成器):使用 Claude 生成可測試的假設
- Experiment Designer (實驗设计器):設計計算實驗
- Execution Engine (執行引擎):使用經過驗證的統計方法運行實驗
- Data Analyst (數據分析器):使用 Claude 解釋結果
- Feedback Loop (反饋循環):基於結果迭代改進假設
技術要求
基礎要求
- Python 3.11 或 3.12
- 以下之一:
- 選項A:Anthropic API 密鑰(按使用付費)
- 選項B:Claude Code CLI 已安裝(需要 Max 訂閱)
安裝指南
基礎安裝
# 克隆倉庫
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos
# 創建虛擬環境
python3.11 -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# 安裝依賴
pip install -e .
# 支持 Claude Code CLI (選項B)
pip install -e ".[router]"
選項A: Anthropic API 配置
# 複製示例配置
cp .env.example .env
# 編輯 .env 並設置你的 API 密鑰
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here
從 console.anthropic.com 獲取你的 API 密鑰
優點:
- 按使用付費
- 無需 CLI 安裝
- 可在任何地方工作
缺點:
- 按 token 收費
- 有速率限制
選項B: Claude Code CLI 配置
# 1. 安裝 Claude Code CLI
# 訪問 https://claude.ai/download 按照說明操作
# 2. 認證 Claude CLI
claude auth
# 3. 複製示例配置
cp .env.example .env
# 4. 編輯 .env 並將 API 密鑰設置為全9(觸發 CLI 路由)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999
這會將所有 API 調用路由到本地 Claude Code CLI,使用你的 Max 訂閱,無需按 token 付費。
優點:
- 無按 token 成本
- 無限使用
- 最新的 Claude 模型
- 本地執行
缺點:
- 需要 Claude CLI 安裝
- 需要 Max 訂閱
數據庫初始化
# 運行數據庫遷移
alembic upgrade head
# 驗證數據庫已創建
ls -la kosmos.db
快速開始
基礎使用示例
from kosmos import ResearchDirector
# 初始化研究主管
director = ResearchDirector()
# 提出研究問題
question = "睡眠剝奪與記憶鞏固之間的關係是什麼?"
# 運行自主研究
results = director.conduct_research(
question=question,
domain="neuroscience",
max_iterations=5
)
# 查看結果
print(results.summary)
print(results.key_findings)
配置選項
所有配置通過環境變量進行(參見 .env.example):
核心配置
ANTHROPIC_API_KEY:API 密鑰或999...用於 CLI 模式CLAUDE_MODEL:要使用的模型(僅 API 模式)DATABASE_URL:數據庫連接字符串LOG_LEVEL:日誌詳細程度
研究配置
MAX_RESEARCH_ITERATIONS:最大自主迭代次數ENABLED_DOMAINS:支持哪些科學領域ENABLED_EXPERIMENT_TYPES:允許的實驗類型MIN_NOVELTY_SCORE:最小新穎性閾值
安全配置
ENABLE_SAFETY_CHECKS:代碼安全驗證MAX_EXPERIMENT_EXECUTION_TIME:實驗超時時間ENABLE_SANDBOXING:沙箱代碼執行REQUIRE_HUMAN_APPROVAL:人工審批門
性能優化
緩存系統
Kosmos 包含多層緩存系統,可降低 30-40% 的 API 成本:
# 查看緩存性能
kosmos cache --stats
# 示例輸出:
# 總體緩存性能:
# 總請求数:500
# 緩存命中:175 (35%)
# 估計節省成本:$15.75
注意:顯著節省成本的提示緩存目前僅在使用 Anthropic Claude 時可用。OpenAI 和本地提供商僅使用內存響應緩存。
智能模型選擇
使用 Anthropic 作為 LLM 提供商時,Kosmos 會根據任務複雜度智能選擇 Claude 模型:
- Claude Sonnet 4.5:複雜推理、假設生成、分析
- Claude Haiku 4:簡單任務、數據提取、格式化
這將成本降低 15-20%,同時保持質量。
注意:此功能特定於 Anthropic Claude。
項目結構
kosmos/
├── core/ # 核心基礎設施 (LLM、配置、日誌)
├── agents/ # 代理實現
├── db/ # 數據庫模型和操作
├── execution/ # 實驗執行引擎
├── analysis/ # 結果分析和可視化
├── hypothesis/ # 假設生成和管理
├── experiments/ # 實驗模板
├── literature/ # 文獻搜索和分析
├── knowledge/ # 知識圖譜和語義搜索
├── domains/ # 領域特定工具 (生物學、物理學等)
├── safety/ # 安全檢查和驗證
└── cli/ # 命令行接口
tests/
├── unit/ # 單元測試
├── integration/ # 集成測試
└── e2e/ # 端到端測試
docs/
├── kosmos-figures-analysis.md # kosmos-figures 的分析模式
├── integration-plan.md # 集成策略
└── domain-roadmaps/ # 領域特定指南
開發測試
# 安裝開發依賴
pip install -e ".[dev]"
# 運行所有測試
pytest
# 運行覆蓋率測試
pytest --cov=kosmos --cov-report=html
# 運行特定測試套件
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/
# 代碼格式化
black kosmos/ tests/
# 代碼檢查
ruff check kosmos/ tests/
# 類型檢查
mypy kosmos/
開發路線圖
✅ 已完成(10個階段)
第1階段:項目基礎 ✅
- 項目結構
- Claude 集成 (API + CLI)
- 配置系統
- 代理框架
- 數據庫設置
第2階段:文獻能力 ✅
- 文獻 API (arXiv、Semantic Scholar、PubMed)
- 文獻分析代理
- 語義搜索向量數據庫
- 知識圖譜
第3階段:假設生成 ✅
- 假設生成器代理
- 新穎性檢查
- 假設優先級排序
第4階段:實驗設計 ✅
- 實驗设计器代理
- 協議模板
- 資源估算
第5階段:實驗執行 ✅
- 沙箱執行環境
- 集成 kosmos-figures 模式
- 統計分析
第6階段:結果分析 ✅
- 數據分析代理
- 可視化生成
- 結果摘要
第7階段:研究編排 ✅
- 研究主管代理
- 反饋循環
- 收斂檢測
第8階段:安全與驗證 ✅
- 安全驗證
- 領域特定工具
第9階段:生產部署 ✅
- 性能優化 (20-40× 提升)
- 多層緩存系統
- 綜合測試 (90%+ 覆蓋率)
第10階段:文檔與完善 ✅
- 豐富的文檔 (10,000+ 行)
- 用戶指南
- API 文檔
- 示例代碼
科學發現案例
Kosmos 已在多個領域產生了經過驗證的科學發現:
1. 代謝組學 - 腦低溫保護
獨立復現了未發表手稿中的發現,識別出核苷酸代謝是低溫小鼠腦中的主要改變途徑。
2. 材料科學 - 太陽能電池效率
發現熱處理期間的濕度是太陽能電池效率的關鍵決定因素,並識別出臨界濕度閾值。
3. 神經科學 - 神經網絡連接
展示了跨物種的大腦網絡遵循對數正態模式,而非冪律模式。
4. 心臟疾病 - SOD2 保護因子
發現 SOD2 蛋白似乎通過減少纖維化來保護心臟。
5. 糖尿病 - SSR1 基因變異
發現 SSR1 基因附近的遺傳變異可能對2型糖尿病具有保護作用。
6. 阿爾茨海默病 - 時序分析方法
提出了一種追蹤疾病腦細胞中蛋白質隨時間變化的新分析技術。
7. 神經退行性疾病 - 磷脂酰絲氨酸暴露
識別出神經元因年齡相關的翻轉酶表達喪失而暴露“吞噬我”信號。
研究效率:獨立科學家發現 Kosmos 報告中 79.4% 的陳述是準確的,合作夥伴報告單次 20 循環 Kosmos 運行平均相當於他們自己 6 個月的研究時間。
靈感來源
本項目受以下工作啟發:
- 論文:Kosmos: An AI Scientist for Autonomous Discovery (2025年11月)
- 分析模式:kosmos-figures 仓库
- Claude Router:claude_n_codex_api_proxy
貢獻指南
歡迎貢獻!請參見 CONTRIBUTING.md 了解指南。
歡迎的貢獻領域:
- 領域特定工具和 API
- 不同領域的實驗模板
- 文獻 API 集成
- 安全驗證
- 文檔
- 測試
授權
MIT License - 詳見 LICENSE
引用
如果你在研究中使用 Kosmos,請引用:
@software{kosmos_ai_scientist,
title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
author={Kosmos Contributors},
year={2025},
url={https://github.com/jimmc414/Kosmos}
}
致謝
- Anthropic 提供 Claude 和 Claude Code
- Edison Scientific 提供 kosmos-figures 分析模式
- 開放科學社區提供文獻 API 和工具
支持與社區
- Issues:GitHub Issues
- 討論:GitHub Discussions
項目狀態
狀態:生產就緒 (v0.2.0) - 所有 10 個開發階段完成
最後更新:2025-11-07
文檔資源
核心優勢總結
- 完全自主:從假設到發現的端到端自動化
- 多領域支持:跨生物學、物理學、化學等多個領域
- 經過驗證:已產生 7 項經過驗證的科學發現
- 成本優化:多層緩存降低 30-40% 成本
- 靈活集成:支持 API 和 CLI 兩種方式
- 安全可靠:沙箱執行、驗證機制、90%+ 測試覆蓋率
- 生產就緒:v0.2.0 版本,所有開發階段完成