Claudeを活用したオープンソースの自律型AI科学者。文献分析、仮説生成、実験設計、実行・分析、反復的改善といった科学研究サイクルを自動で実行可能
Kosmos - 自主AI科学者プラットフォームの詳細な紹介
プロジェクト概要
Kosmosは、文献分析と仮説生成から実験設計、実行、分析、反復改善まで、完全な科学研究サイクルを実行できるオープンソースの自主AI科学者実装です。このプロジェクトは2025年11月に発表されたKosmos AI論文(https://arxiv.org/abs/2511.02824)に基づいており、Claude CodeまたはAnthropic APIによって駆動することができます。
核心特性
🔬 自主的な研究サイクル
- エンドツーエンドの科学ワークフロー: 完全な研究周期の自動化
- 多領域サポート: 生物学、物理学、化学、神経科学、材料科学
- 反復改善: 結果に基づく仮説と実験設計の自動最適化
🤖 AI駆動のスマートシステム
- Claude Sonnet 4 駆動: 仮説生成と高度な分析用
- マルチモデルサポート: Anthropic Claude、OpenAI GPT、ローカルモデル(Ollama、LM Studio)のサポート
- スマートモデル選択: タスクの複雑さに基づいて最適なモデルを選択
🔧 柔軟な統合方法
- デュアル統合オプション:
- オプションA: Anthropic API(使用量課金)
- オプションB: Claude Code CLI(Maxサブスクリプションが必要)
- 成熟した分析モード: kosmos-figuresからの実証済み統計手法の統合
📚 文献統合
- 自動論文検索: arXiv、Semantic Scholar、PubMedのサポート
- 文献要約: キー情報の自動抽出
- 新規性チェック: 研究仮説の新規性の確認
🏗️ エージェントアーキテクチャ
- モジュール化設計: 各研究タスクに対応する独立したエージェント
- 並列実行: 複数の研究タスクの同時実行
- 協調作業: 構造化された世界モデルを通じたエージェント間の情報共有
🛡️ セキュリティ優先
- サンドボックス実行: 分離されたコード実行環境
- 検証メカニズム: 結果の検証と再現性チェック
- 人間による承認ゲート: オプションの人間によるレビュー
💰 コスト最適化
- マルチレイヤーキャッシュシステム: APIコストを30-40%削減
- スマートプロンプトキャッシュ: Anthropicを使用時の大幅なコスト削減
- モデル選択最適化: タスクの複雑さに基づいたモデル選択で15-20%のコスト削減
システムアーキテクチャ
核心コンポーネント
┌─────────────────────────────────────────────────────────────┐
│ Research Director │
│ (自主的な研究サイクルを調整するメインコントローラ) │
└──────────────┬──────────────────────────────────────────────┘
│
┌──────────────┴────────┬───────────────┬──────────────┐
│ │ │ │
┌───▼────┐ ┌─────────▼──────────┐ ┌▼──────────┐ ┌▼─────────────┐
│Literature│ │Hypothesis Generator│ │Experiment │ │Data Analyst │
│Analyzer │ │ (Claude) │ │Designer │ │ (Claude) │
└───┬────┘ └─────────┬──────────┘ └┬──────────┘ └┬─────────────┘
│ │ │ │
└──────────────────┴───────────────┴─────────────┘
│
┌──────────▼──────────┐
│ Execution Engine │
│ (kosmos-figures │
│ proven patterns) │
└─────────────────────┘
エージェントの説明
- Research Director (研究主管): 研究ワークフローを管理する主要なコーディネーター
- Literature Analyzer (文献分析器): 科学論文(arXiv、Semantic Scholar、PubMed)の検索と分析
- Hypothesis Generator (仮説生成器): Claudeを使用してテスト可能な仮説を生成
- Experiment Designer (実験デザイナー): 計算実験の設計
- Execution Engine (実行エンジン): 実証済みの統計手法を使用して実験を実行
- Data Analyst (データアナリスト): Claudeを使用して結果を解釈
- Feedback Loop (フィードバックループ): 結果に基づいて仮説を反復的に改善
技術要件
基本要件
- Python 3.11 または 3.12
- 以下のいずれか:
- オプションA: Anthropic APIキー(使用量課金)
- オプションB: Claude Code CLIがインストールされている(Maxサブスクリプションが必要)
インストールガイド
基本インストール
# リポジトリのクローン
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos
# 仮想環境の作成
python3.11 -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# 依存関係のインストール
pip install -e .
# Claude Code CLIのサポート (オプションB)
pip install -e ".[router]"
オプションA: Anthropic APIの設定
# 例の設定ファイルのコピー
cp .env.example .env
# .envを編集し、APIキーを設定
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here
console.anthropic.com からAPIキーを取得
利点:
- 使用量課金
- CLIのインストール不要
- どこでも利用可能
欠点:
- トークン単位での課金
- レート制限あり
オプションB: Claude Code CLIの設定
# 1. Claude Code CLIのインストール
# https://claude.ai/download にアクセスし、指示に従ってください
# 2. Claude CLIの認証
claude auth
# 3. 例の設定ファイルのコピー
cp .env.example .env
# 4. .envを編集し、APIキーを9で埋める(CLIルーティングをトリガー)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999
これにより、すべてのAPI呼び出しがローカルのClaude Code CLIにルーティングされ、Maxサブスクリプションを使用してトークン単位での課金なしで動作します。
利点:
- トークン単位のコストなし
- 制限なく使用可能
- 最新のClaudeモデル
- ローカル実行
欠点:
- Claude CLIのインストールが必要
- Maxサブスクリプションが必要
データベースの初期化
# データベースマイグレーションの実行
alembic upgrade head
# データベースが作成されていることを確認
ls -la kosmos.db
速攻スタート
基本的な使用例
from kosmos import ResearchDirector
# 研究主管の初期化
director = ResearchDirector()
# 研究問題の提案
question = "睡眠不足と記憶の固定化の間の関係は何ですか?"
# 自主的な研究の実行
results = director.conduct_research(
question=question,
domain="neuroscience",
max_iterations=5
)
# 結果の表示
print(results.summary)
print(results.key_findings)
設定オプション
すべての設定は環境変数を通じて行われます(.env.exampleを参照):
核心設定
ANTHROPIC_API_KEY: APIキーまたは999...(CLIモード用)CLAUDE_MODEL: 使用するモデル(APIモードのみ)DATABASE_URL: データベース接続文字列LOG_LEVEL: ログの詳細度
研究設定
MAX_RESEARCH_ITERATIONS: 最大の自主的な反復回数ENABLED_DOMAINS: サポートする科学分野ENABLED_EXPERIMENT_TYPES: 許可される実験タイプMIN_NOVELTY_SCORE: 最小の新規性スコア
セキュリティ設定
ENABLE_SAFETY_CHECKS: コードのセキュリティ検証MAX_EXPERIMENT_EXECUTION_TIME: 実験のタイムアウト時間ENABLE_SANDBOXING: サンドボックスコード実行REQUIRE_HUMAN_APPROVAL: 人間による承認ゲート
パフォーマンス最適化
キャッシュシステム
Kosmosには、APIコストを30-40%削減するマルチレイヤーキャッシュシステムが含まれています:
# キャッシュパフォーマンスの確認
kosmos cache --stats
# 例の出力:
# 全体のキャッシュパフォーマンス:
# トータルリクエスト数: 500
# キャッシュヒット: 175 (35%)
# 推定節約額: $15.75
注意: 明確なコスト削減のためのプロンプトキャッシュは、現在Anthropic Claudeを使用する場合にのみ利用可能です。OpenAIとローカルプロバイダーでは、メモリレスポンスキャッシュのみが使用されます。
スマートモデル選択
AnthropicをLLMプロバイダーとして使用する場合、Kosmosはタスクの複雑さに基づいてClaudeモデルを選択します:
- Claude Sonnet 4.5: 複雑な推論、仮説生成、分析
- Claude Haiku 4: 単純なタスク、データ抽出、フォーマット
これにより、15-20%のコスト削減が可能になりながら品質を維持します。
注意: この機能はAnthropic Claude専用です。
プロジェクト構造
kosmos/
├── core/ # 核心インフラストラクチャ(LLM、設定、ログ)
├── agents/ # エージェントの実装
├── db/ # データベースモデルと操作
├── execution/ # 実験実行エンジン
├── analysis/ # 結果の分析と視覚化
├── hypothesis/ # 仮説生成と管理
├── experiments/ # 実験テンプレート
├── literature/ # 文献検索と分析
├── knowledge/ # 知識グラフと意味検索
├── domains/ # 分野固有のツール(生物学、物理学など)
├── safety/ # セキュリティチェックと検証
└── cli/ # コマンドラインインターフェース
tests/
├── unit/ # ユニットテスト
├── integration/ # 統合テスト
└── e2e/ # エンドツーエンドテスト
docs/
├── kosmos-figures-analysis.md # kosmos-figuresの分析モード
├── integration-plan.md # 統合戦略
└── domain-roadmaps/ # 分野固有のガイド
開発テスト
# 開発依存関係のインストール
pip install -e ".[dev]"
# すべてのテストの実行
pytest
# カバレッジテストの実行
pytest --cov=kosmos --cov-report=html
# 特定のテストスイートの実行
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/
# コードフォーマット
black kosmos/ tests/
# コードチェック
ruff check kosmos/ tests/
# タイプチェック
mypy kosmos/
開発ロードマップ
✅ 完了済み(10フェーズ)
第1フェーズ: プロジェクト基礎 ✅
- プロジェクト構造
- Claudeの統合(API + CLI)
- 設定システム
- エージェントフレームワーク
- データベース設定
第2フェーズ: 文献能力 ✅
- 文献API(arXiv、Semantic Scholar、PubMed)
- 文献分析エージェント
- 意味検索ベクトルデータベース
- 知識グラフ
第3フェーズ: 仮説生成 ✅
- 仮説生成エージェント
- 新規性チェック
- 仮説の優先順位付け
第4フェーズ: 実験設計 ✅
- 実験デザイナーエージェント
- プロトコルテンプレート
- リソース見積もり
第5フェーズ: 実験実行 ✅
- サンドボックス実行環境
- kosmos-figuresパターンの統合
- 統計分析
第6フェーズ: 結果分析 ✅
- データ分析エージェント
- 可視化生成
- 結果の要約
第7フェーズ: 研究オーケストレーション ✅
- 研究主管エージェント
- フィードバックループ
- 収束検出
第8フェーズ: セキュリティと検証 ✅
- セキュリティ検証
- 分野固有のツール
第9フェーズ: 本番展開 ✅
- パフォーマンス最適化(20-40倍の向上)
- マルチレイヤーキャッシュシステム
- 総合テスト(90%以上のカバレッジ)
第10フェーズ: ドキュメントと完成 ✅
- 豊富なドキュメント(10,000行以上)
- ユーザーガイド
- APIドキュメント
- 例のコード
科学的発見事例
Kosmosは、複数の分野で検証された科学的発見を生み出しています:
1. メタボロミクス - 脳低温保護
未発表の原稿の発見を独立して再現し、核苷酸代謝が低温下のマウス脳における主要な変化経路であることを確認しました。
2. 材料科学 - 太陽電池効率
熱処理中の湿度が太陽電池効率の重要な決定要因であり、臨界湿度閾値を特定しました。
3. 神経科学 - ニューラルネットワーク接続
種を超えた脳ネットワークが対数正規パターンではなく、べき乗則パターンに従うことを示しました。
4. 心臓疾患 - SOD2保護因子
SOD2タンパク質が線維化を減少させることで心臓を保護することを発見しました。
5. 糖尿病 - SSR1遺伝子変異
SSR1遺伝子近くの遺伝的変異が2型糖尿病に対して保護作用を持つ可能性があることを発見しました。
6. アルツハイマー病 - 時系列分析法
新しい分析技術を提案し、疾患脳細胞内のタンパク質の時間経過を追跡しました。
7. 神経変性疾患 - リゾホスファチジルシリン暴露
神経細胞が加齢に関連して翻転酵素の発現喪失により「私を食べなさい」信号を露出することが判明しました。
研究効率: 独立した科学者がKosmosレポートの79.4%の記述が正確であると報告し、共同研究者は単一の20回のKosmos実行が彼ら自身の6ヶ月の研究時間に相当すると報告しました。
着想の源
このプロジェクトは以下の研究から着想を得ています:
- 論文: Kosmos: An AI Scientist for Autonomous Discovery (2025年11月)
- 分析パターン: kosmos-figures リポジトリ
- Claude Router: claude_n_codex_api_proxy
貢献ガイド
貢献をお待ちしております!詳しくは CONTRIBUTING.md をご覧ください。
歓迎される貢献領域:
- 分野固有のツールとAPI
- 異なる分野の実験テンプレート
- 文献APIの統合
- セキュリティ検証
- ドキュメント
- テスト
ライセンス
MIT License - 詳細は LICENSE をご覧ください。
引用
Kosmosを使用して研究を行った場合は、以下のように引用してください:
@software{kosmos_ai_scientist,
title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
author={Kosmos Contributors},
year={2025},
url={https://github.com/jimmc414/Kosmos}
}
謝辞
- Anthropicが提供するClaudeとClaude Code
- Edison Scientificが提供するkosmos-figures分析パターン
- 開放科学コミュニティが提供する文献APIとツール
サポートとコミュニティ
- Issues: GitHub Issues
- ディスカッション: GitHub Discussions
プロジェクト状況
状態: 本番対応 (v0.2.0) - すべての10つの開発フェーズが完了
最終更新: 2025-11-07
ドキュメントリソース
- アーキテクチャ概要 - システム設計とコンポーネント
- 統合計画 - kosmos-figuresパターンの統合方法
- 分野ロードマップ - 分野固有の実装ガイド
- APIリファレンス - APIドキュメント
- 貢献ガイド - どのように貢献するか
核心的な優位性のまとめ
- 完全に自主的: 仮説から発見までのエンドツーエンドの自動化
- 多領域サポート: 生物学、物理学、化学など複数の分野をサポート
- 検証済み: 7つの検証された科学的発見を生み出した
- コスト最適化: マルチレイヤーキャッシュにより30-40%のコスト削減
- 柔軟な統合: APIとCLIの両方をサポート
- 安全で信頼性が高い: サンドボックス実行、検証メカニズム、90%以上のテストカバレッジ
- 本番対応: v0.2.0版、すべての開発フェーズが完了