Claude 기반의 오픈소스 자율형 AI 과학자로, 문헌 분석, 가설 생성, 실험 설계, 실행 분석 및 반복적 개선을 포함한 완전한 과학 연구 사이클을 자동으로 수행할 수 있습니다.

PythonKosmosjimmc414 308 Last Updated: December 12, 2025

Kosmos - 자율적인 AI 과학자 플랫폼 소개

프로젝트 개요

Kosmos는 완전한 과학 연구 주기를 수행할 수 있는 오픈 소스 자율적인 AI 과학자 구현입니다: 문헌 분석과 가설 생성, 실험 설계, 실행, 분석 및 반복적 개선까지. 이 프로젝트는 2025년 11월에 발표된 Kosmos AI 논문(https://arxiv.org/abs/2511.02824)을 기반으로 하며, Claude Code 또는 Anthropic API를 통해 구동할 수 있도록 적응되었습니다.

핵심 특징

🔬 자율적인 연구 주기

  • 엔드 투 엔드 과학 워크플로: 완전한 연구 주기 자동화
  • 다양한 분야 지원: 생물학, 물리학, 화학, 신경과학, 재료과학
  • 반복적 개선: 결과에 기반하여 가설과 실험 설계 자동 최적화

🤖 AI 기반 지능 시스템

  • Claude Sonnet 4 구동: 가설 생성 및 고급 분석을 위한 사용
  • 다중 모델 지원: Anthropic Claude, OpenAI GPT, 로컬 모델(Ollama, LM Studio)
  • 지능형 모델 선택: 작업 복잡도에 따라 최적의 모델 자동 선택

🔧 유연한 통합 방법

  • 이중 통합 옵션:
    • 옵션 A: Anthropic API(사용량에 따른 요금)
    • 옵션 B: Claude Code CLI(Max 구독 필요)
  • 성숙한 분석 모드: kosmos-figures에서 검증된 통계 방법 통합

📚 문헌 통합

  • 자동화된 논문 검색: arXiv, Semantic Scholar, PubMed 지원
  • 문헌 요약: 주요 정보 자동 추출
  • 신규성 확인: 연구 가설의 혁신성 확인

🏗️ 에이전트 아키텍처

  • 모듈화 설계: 각 연구 작업에 독립적인 에이전트
  • 병렬 실행: 여러 연구 작업 동시 실행
  • 협업: 구조화된 세계 모델을 통해 에이전트 간 정보 공유

🛡️ 보안 우선

  • 샌드박스 실행: 격리된 코드 실행 환경
  • 검증 메커니즘: 결과 검증 및 재현성 확인
  • 인간 승인 게이트: 선택적 인간 검토 단계

💰 비용 최적화

  • 다층 캐시 시스템: 30-40%의 API 비용 절감
  • 지능형 프롬프트 캐시: Anthropic 사용 시 상당한 비용 절감
  • 모델 선택 최적화: 작업 복잡도에 따라 모델 지능형 선택, 15-20% 비용 절감

시스템 아키텍처

핵심 구성 요소

┌─────────────────────────────────────────────────────────────┐
│                    Research Director                         │
│              (자율적인 연구 주기를 조정하는 주 제어기)          │
└──────────────┬──────────────────────────────────────────────┘
               │
┌──────────────┴────────┬───────────────┬──────────────┐
│                       │               │              │
┌───▼────┐   ┌─────────▼──────────┐  ┌▼──────────┐ ┌▼─────────────┐
│Literature│  │Hypothesis Generator│  │Experiment │ │Data Analyst  │
│Analyzer  │  │     (Claude)       │  │Designer   │ │   (Claude)   │
└───┬────┘   └─────────┬──────────┘  └┬──────────┘ └┬─────────────┘
    │                  │               │             │
    └──────────────────┴───────────────┴─────────────┘
                       │
            ┌──────────▼──────────┐
            │  Execution Engine   │
            │   (kosmos-figures   │
            │   proven patterns)  │
            └─────────────────────┘

에이전트 설명

  • Research Director (연구 책임자): 연구 워크플로를 관리하는 주 조정자
  • Literature Analyzer (문헌 분석기): 과학 논문(arXiv, Semantic Scholar, PubMed) 검색 및 분석
  • Hypothesis Generator (가설 생성기): Claude를 사용하여 검증 가능한 가설 생성
  • Experiment Designer (실험 설계자): 계산 실험 설계
  • Execution Engine (실행 엔진): 검증된 통계 방법을 사용하여 실험 실행
  • Data Analyst (데이터 분석기): Claude를 사용하여 결과 해석
  • Feedback Loop (피드백 루프): 결과에 기반하여 가설 반복적 개선

기술 요구 사항

기본 요구 사항

  • Python 3.11 또는 3.12
  • 다음 중 하나:
    • 옵션 A: Anthropic API 키(사용량에 따른 요금)
    • 옵션 B: Claude Code CLI 설치(Max 구독 필요)

설치 가이드

기본 설치

# 저장소 복제
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos

# 가상 환경 생성
python3.11 -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# 의존성 설치
pip install -e .

# Claude Code CLI 지원 (옵션 B)
pip install -e ".[router]"

옵션 A: Anthropic API 설정

# 예제 구성 복사
cp .env.example .env

# .env 편집 및 API 키 설정
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here

console.anthropic.com에서 API 키 얻기

장점:

  • 사용량에 따른 요금
  • CLI 설치 불필요
  • 어디서든 작동 가능

단점:

  • 토큰 단위 요금
  • 속도 제한 있음

옵션 B: Claude Code CLI 설정

# 1. Claude Code CLI 설치
# https://claude.ai/download 방문하여 지침 따르기

# 2. Claude CLI 인증
claude auth

# 3. 예제 구성 복사
cp .env.example .env

# 4. .env 편집 및 API 키를 모두 9로 설정(CLI 라우팅 트리거)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999

이 설정은 모든 API 호출을 로컬 Claude Code CLI로 라우팅하여 Max 구독을 사용하고, 토큰 단위 요금 없이 작동합니다.

장점:

  • 토큰 단위 비용 없음
  • 무제한 사용
  • 최신 Claude 모델
  • 로컬 실행

단점:

  • Claude CLI 설치 필요
  • Max 구독 필요

데이터베이스 초기화

# 데이터베이스 마이그레이션 실행
alembic upgrade head

# 데이터베이스 생성 확인
ls -la kosmos.db

빠른 시작

기본 사용 예제

from kosmos import ResearchDirector

# 연구 책임자 초기화
director = ResearchDirector()

# 연구 문제 제기
question = "수면 부족과 기억 강화 사이의 관계는 무엇인가?"

# 자율적인 연구 실행
results = director.conduct_research(
    question=question,
    domain="neuroscience",
    max_iterations=5
)

# 결과 확인
print(results.summary)
print(results.key_findings)

구성 옵션

모든 구성은 환경 변수를 통해 이루어집니다(참조: .env.example):

핵심 구성

  • ANTHROPIC_API_KEY: API 키 또는 999... (CLI 모드)
  • CLAUDE_MODEL: 사용할 모델(API 모드만)
  • DATABASE_URL: 데이터베이스 연결 문자열
  • LOG_LEVEL: 로그 세부 수준

연구 구성

  • MAX_RESEARCH_ITERATIONS: 최대 자율적인 반복 횟수
  • ENABLED_DOMAINS: 지원되는 과학 분야
  • ENABLED_EXPERIMENT_TYPES: 허용된 실험 유형
  • MIN_NOVELTY_SCORE: 최소 신규성 임계값

보안 구성

  • ENABLE_SAFETY_CHECKS: 코드 안전 검증
  • MAX_EXPERIMENT_EXECUTION_TIME: 실험 시간 초과
  • ENABLE_SANDBOXING: 샌드박스 코드 실행
  • REQUIRE_HUMAN_APPROVAL: 인간 승인 게이트

성능 최적화

캐시 시스템

Kosmos는 다층 캐시 시스템을 포함하여 30-40%의 API 비용을 절감합니다:

# 캐시 성능 확인
kosmos cache --stats

# 예제 출력:
# 전체 캐시 성능:
# 총 요청 수: 500
# 캐시 히트: 175 (35%)
# 예상 비용 절감: $15.75

주의: 현재 Anthropic Claude 사용 시 상당한 비용 절감이 가능한 프롬프트 캐시만 제공됩니다. OpenAI 및 로컬 제공업체는 메모리 응답 캐시만 사용합니다.

지능형 모델 선택

Anthropic를 LLM 제공업체로 사용할 때, Kosmos는 작업 복잡도에 따라 Claude 모델을 지능적으로 선택합니다:

  • Claude Sonnet 4.5: 복잡한 추론, 가설 생성, 분석
  • Claude Haiku 4: 간단한 작업, 데이터 추출, 포맷팅

이는 15-20%의 비용을 절감하면서 품질을 유지합니다.

주의: 이 기능은 Anthropic Claude에 특정합니다.

프로젝트 구조

kosmos/
├── core/              # 핵심 인프라(LLM, 구성, 로그)
├── agents/            # 에이전트 구현
├── db/                # 데이터베이스 모델 및 작업
├── execution/         # 실험 실행 엔진
├── analysis/          # 결과 분석 및 시각화
├── hypothesis/        # 가설 생성 및 관리
├── experiments/       # 실험 템플릿
├── literature/        # 문헌 검색 및 분석
├── knowledge/         # 지식 그래프 및 의미 검색
├── domains/           # 분야별 도구(생물학, 물리학 등)
├── safety/            # 보안 검사 및 검증
└── cli/               # 명령줄 인터페이스

tests/
├── unit/              # 단위 테스트
├── integration/       # 통합 테스트
└── e2e/               # 엔드 투 엔드 테스트

docs/
├── kosmos-figures-analysis.md      # kosmos-figures의 분석 모드
├── integration-plan.md             # 통합 전략
└── domain-roadmaps/                # 분야별 가이드

개발 및 테스트

# 개발 의존성 설치
pip install -e ".[dev]"

# 모든 테스트 실행
pytest

# 커버리지 테스트 실행
pytest --cov=kosmos --cov-report=html

# 특정 테스트 스위트 실행
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/

# 코드 포맷팅
black kosmos/ tests/

# 코드 검사
ruff check kosmos/ tests/

# 타입 검사
mypy kosmos/

개발 로드맵

✅ 완료(10개 단계)

단계 1: 프로젝트 기초 ✅

  • 프로젝트 구조
  • Claude 통합(API + CLI)
  • 구성 시스템
  • 에이전트 프레임워크
  • 데이터베이스 설정

단계 2: 문헌 기능 ✅

  • 문헌 API(arXiv, Semantic Scholar, PubMed)
  • 문헌 분석 에이전트
  • 의미 검색 벡터 데이터베이스
  • 지식 그래프

단계 3: 가설 생성 ✅

  • 가설 생성기 에이전트
  • 신규성 확인
  • 가설 우선순위 정렬

단계 4: 실험 설계 ✅

  • 실험 설계자 에이전트
  • 프로토콜 템플릿
  • 리소스 추정

단계 5: 실험 실행 ✅

  • 샌드박스 실행 환경
  • kosmos-figures 패턴 통합
  • 통계 분석

단계 6: 결과 분석 ✅

  • 데이터 분석 에이전트
  • 시각화 생성
  • 결과 요약

단계 7: 연구 오케스트레이션 ✅

  • 연구 책임자 에이전트
  • 피드백 루프
  • 수렴 감지

단계 8: 보안 및 검증 ✅

  • 보안 검증
  • 분야별 도구

단계 9: 생산 배포 ✅

  • 성능 최적화(20-40× 향상)
  • 다층 캐시 시스템
  • 종합 테스트(90%+ 커버리지)

단계 10: 문서 및 완성 ✅

  • 풍부한 문서(10,000+ 줄)
  • 사용자 가이드
  • API 문서
  • 예제 코드

과학적 발견 사례

Kosmos는 여러 분야에서 검증된 과학적 발견을 만들어냈습니다:

1. 대사체학 - 뇌 저온 보호

미발표 원고의 발견을 독립적으로 재현하여, 저온 상태의 마우스 뇌에서 핵산 대사가 주요 변화 경로임을 확인했습니다.

2. 재료 과학 - 태양광 전지 효율

열 처리 중 습도가 태양광 전지 효율의 주요 결정 요소임을 발견하고, 임계 습도 임계값을 식별했습니다.

3. 신경과학 - 신경 네트워크 연결

종 간의 뇌 네트워크가 로그-노멀 패턴을 따르는 것으로 나타났습니다.

4. 심장 질환 - SOD2 보호 인자

SOD2 단백질이 섬유화를 줄여 심장을 보호하는 것으로 나타났습니다.

5. 당뇨병 - SSR1 유전자 변이

SSR1 유전자 근처의 유전자 변이가 2형 당뇨병에 대해 보호 효과가 있을 수 있음을 발견했습니다.

6. 알츠하이머병 - 시계열 분석 방법

질병의 뇌 세포에서 단백질의 시간 변화를 추적하는 새로운 분석 기법을 제안했습니다.

7. 신경퇴행성 질환 - 포스파티딜세린 노출

노화로 인해 플립라제 발현이 감소하여 신경 세포가 "먹어주세요" 신호를 노출함을 확인했습니다.

연구 효율성: 독립적인 과학자들이 Kosmos 보고서의 79.4%의 진술이 정확하다고 보고했으며, 협력자는 단일 20회 순환 Kosmos 실행이 그들 자신의 6개월 연구 시간과 동등하다고 보고했습니다.

영감의 원천

이 프로젝트는 다음과 같은 작업에서 영감을 받았습니다:

기여 가이드

기여를 환영합니다! CONTRIBUTING.md 참조.

환영받는 기여 영역:

  • 분야별 도구 및 API
  • 다양한 분야의 실험 템플릿
  • 문헌 API 통합
  • 보안 검증
  • 문서
  • 테스트

라이선스

MIT License - LICENSE 참조

인용

Kosmos를 연구에서 사용했다면, 다음을 인용하세요:

@software{kosmos_ai_scientist,
  title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
  author={Kosmos Contributors},
  year={2025},
  url={https://github.com/jimmc414/Kosmos}
}

감사의 말

  • Anthropic: Claude 및 Claude Code 제공
  • Edison Scientific: kosmos-figures 분석 모드 제공
  • 오픈 과학 커뮤니티: 문헌 API 및 도구 제공

지원 및 커뮤니티

프로젝트 상태

상태: 생산 준비 완료 (v0.2.0) - 모든 10개 개발 단계 완료

최종 업데이트: 2025-11-07


문서 자원

핵심 장점 요약

  1. 완전 자율: 가설부터 발견까지의 엔드 투 엔드 자동화
  2. 다양한 분야 지원: 생물학, 물리학, 화학 등 여러 분야 지원
  3. 검증됨: 7개의 검증된 과학적 발견 생성
  4. 비용 최적화: 다층 캐시를 통해 30-40% 비용 절감
  5. 유연한 통합: API와 CLI 두 가지 방식 지원
  6. 보안 및 신뢰성: 샌드박스 실행, 검증 메커니즘, 90%+ 테스트 커버리지
  7. 생산 준비: v0.2.0 버전, 모든 개발 단계 완료

Star History Chart