Claude 기반의 오픈소스 자율형 AI 과학자로, 문헌 분석, 가설 생성, 실험 설계, 실행 분석 및 반복적 개선을 포함한 완전한 과학 연구 사이클을 자동으로 수행할 수 있습니다.
Kosmos - 자율적인 AI 과학자 플랫폼 소개
프로젝트 개요
Kosmos는 완전한 과학 연구 주기를 수행할 수 있는 오픈 소스 자율적인 AI 과학자 구현입니다: 문헌 분석과 가설 생성, 실험 설계, 실행, 분석 및 반복적 개선까지. 이 프로젝트는 2025년 11월에 발표된 Kosmos AI 논문(https://arxiv.org/abs/2511.02824)을 기반으로 하며, Claude Code 또는 Anthropic API를 통해 구동할 수 있도록 적응되었습니다.
핵심 특징
🔬 자율적인 연구 주기
- 엔드 투 엔드 과학 워크플로: 완전한 연구 주기 자동화
- 다양한 분야 지원: 생물학, 물리학, 화학, 신경과학, 재료과학
- 반복적 개선: 결과에 기반하여 가설과 실험 설계 자동 최적화
🤖 AI 기반 지능 시스템
- Claude Sonnet 4 구동: 가설 생성 및 고급 분석을 위한 사용
- 다중 모델 지원: Anthropic Claude, OpenAI GPT, 로컬 모델(Ollama, LM Studio)
- 지능형 모델 선택: 작업 복잡도에 따라 최적의 모델 자동 선택
🔧 유연한 통합 방법
- 이중 통합 옵션:
- 옵션 A: Anthropic API(사용량에 따른 요금)
- 옵션 B: Claude Code CLI(Max 구독 필요)
- 성숙한 분석 모드: kosmos-figures에서 검증된 통계 방법 통합
📚 문헌 통합
- 자동화된 논문 검색: arXiv, Semantic Scholar, PubMed 지원
- 문헌 요약: 주요 정보 자동 추출
- 신규성 확인: 연구 가설의 혁신성 확인
🏗️ 에이전트 아키텍처
- 모듈화 설계: 각 연구 작업에 독립적인 에이전트
- 병렬 실행: 여러 연구 작업 동시 실행
- 협업: 구조화된 세계 모델을 통해 에이전트 간 정보 공유
🛡️ 보안 우선
- 샌드박스 실행: 격리된 코드 실행 환경
- 검증 메커니즘: 결과 검증 및 재현성 확인
- 인간 승인 게이트: 선택적 인간 검토 단계
💰 비용 최적화
- 다층 캐시 시스템: 30-40%의 API 비용 절감
- 지능형 프롬프트 캐시: Anthropic 사용 시 상당한 비용 절감
- 모델 선택 최적화: 작업 복잡도에 따라 모델 지능형 선택, 15-20% 비용 절감
시스템 아키텍처
핵심 구성 요소
┌─────────────────────────────────────────────────────────────┐
│ Research Director │
│ (자율적인 연구 주기를 조정하는 주 제어기) │
└──────────────┬──────────────────────────────────────────────┘
│
┌──────────────┴────────┬───────────────┬──────────────┐
│ │ │ │
┌───▼────┐ ┌─────────▼──────────┐ ┌▼──────────┐ ┌▼─────────────┐
│Literature│ │Hypothesis Generator│ │Experiment │ │Data Analyst │
│Analyzer │ │ (Claude) │ │Designer │ │ (Claude) │
└───┬────┘ └─────────┬──────────┘ └┬──────────┘ └┬─────────────┘
│ │ │ │
└──────────────────┴───────────────┴─────────────┘
│
┌──────────▼──────────┐
│ Execution Engine │
│ (kosmos-figures │
│ proven patterns) │
└─────────────────────┘
에이전트 설명
- Research Director (연구 책임자): 연구 워크플로를 관리하는 주 조정자
- Literature Analyzer (문헌 분석기): 과학 논문(arXiv, Semantic Scholar, PubMed) 검색 및 분석
- Hypothesis Generator (가설 생성기): Claude를 사용하여 검증 가능한 가설 생성
- Experiment Designer (실험 설계자): 계산 실험 설계
- Execution Engine (실행 엔진): 검증된 통계 방법을 사용하여 실험 실행
- Data Analyst (데이터 분석기): Claude를 사용하여 결과 해석
- Feedback Loop (피드백 루프): 결과에 기반하여 가설 반복적 개선
기술 요구 사항
기본 요구 사항
- Python 3.11 또는 3.12
- 다음 중 하나:
- 옵션 A: Anthropic API 키(사용량에 따른 요금)
- 옵션 B: Claude Code CLI 설치(Max 구독 필요)
설치 가이드
기본 설치
# 저장소 복제
git clone https://github.com/jimmc414/Kosmos.git
cd Kosmos
# 가상 환경 생성
python3.11 -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# 의존성 설치
pip install -e .
# Claude Code CLI 지원 (옵션 B)
pip install -e ".[router]"
옵션 A: Anthropic API 설정
# 예제 구성 복사
cp .env.example .env
# .env 편집 및 API 키 설정
# ANTHROPIC_API_KEY=sk-ant-api03-your-actual-key-here
console.anthropic.com에서 API 키 얻기
장점:
- 사용량에 따른 요금
- CLI 설치 불필요
- 어디서든 작동 가능
단점:
- 토큰 단위 요금
- 속도 제한 있음
옵션 B: Claude Code CLI 설정
# 1. Claude Code CLI 설치
# https://claude.ai/download 방문하여 지침 따르기
# 2. Claude CLI 인증
claude auth
# 3. 예제 구성 복사
cp .env.example .env
# 4. .env 편집 및 API 키를 모두 9로 설정(CLI 라우팅 트리거)
# ANTHROPIC_API_KEY=999999999999999999999999999999999999999999999999
이 설정은 모든 API 호출을 로컬 Claude Code CLI로 라우팅하여 Max 구독을 사용하고, 토큰 단위 요금 없이 작동합니다.
장점:
- 토큰 단위 비용 없음
- 무제한 사용
- 최신 Claude 모델
- 로컬 실행
단점:
- Claude CLI 설치 필요
- Max 구독 필요
데이터베이스 초기화
# 데이터베이스 마이그레이션 실행
alembic upgrade head
# 데이터베이스 생성 확인
ls -la kosmos.db
빠른 시작
기본 사용 예제
from kosmos import ResearchDirector
# 연구 책임자 초기화
director = ResearchDirector()
# 연구 문제 제기
question = "수면 부족과 기억 강화 사이의 관계는 무엇인가?"
# 자율적인 연구 실행
results = director.conduct_research(
question=question,
domain="neuroscience",
max_iterations=5
)
# 결과 확인
print(results.summary)
print(results.key_findings)
구성 옵션
모든 구성은 환경 변수를 통해 이루어집니다(참조: .env.example):
핵심 구성
ANTHROPIC_API_KEY: API 키 또는999...(CLI 모드)CLAUDE_MODEL: 사용할 모델(API 모드만)DATABASE_URL: 데이터베이스 연결 문자열LOG_LEVEL: 로그 세부 수준
연구 구성
MAX_RESEARCH_ITERATIONS: 최대 자율적인 반복 횟수ENABLED_DOMAINS: 지원되는 과학 분야ENABLED_EXPERIMENT_TYPES: 허용된 실험 유형MIN_NOVELTY_SCORE: 최소 신규성 임계값
보안 구성
ENABLE_SAFETY_CHECKS: 코드 안전 검증MAX_EXPERIMENT_EXECUTION_TIME: 실험 시간 초과ENABLE_SANDBOXING: 샌드박스 코드 실행REQUIRE_HUMAN_APPROVAL: 인간 승인 게이트
성능 최적화
캐시 시스템
Kosmos는 다층 캐시 시스템을 포함하여 30-40%의 API 비용을 절감합니다:
# 캐시 성능 확인
kosmos cache --stats
# 예제 출력:
# 전체 캐시 성능:
# 총 요청 수: 500
# 캐시 히트: 175 (35%)
# 예상 비용 절감: $15.75
주의: 현재 Anthropic Claude 사용 시 상당한 비용 절감이 가능한 프롬프트 캐시만 제공됩니다. OpenAI 및 로컬 제공업체는 메모리 응답 캐시만 사용합니다.
지능형 모델 선택
Anthropic를 LLM 제공업체로 사용할 때, Kosmos는 작업 복잡도에 따라 Claude 모델을 지능적으로 선택합니다:
- Claude Sonnet 4.5: 복잡한 추론, 가설 생성, 분석
- Claude Haiku 4: 간단한 작업, 데이터 추출, 포맷팅
이는 15-20%의 비용을 절감하면서 품질을 유지합니다.
주의: 이 기능은 Anthropic Claude에 특정합니다.
프로젝트 구조
kosmos/
├── core/ # 핵심 인프라(LLM, 구성, 로그)
├── agents/ # 에이전트 구현
├── db/ # 데이터베이스 모델 및 작업
├── execution/ # 실험 실행 엔진
├── analysis/ # 결과 분석 및 시각화
├── hypothesis/ # 가설 생성 및 관리
├── experiments/ # 실험 템플릿
├── literature/ # 문헌 검색 및 분석
├── knowledge/ # 지식 그래프 및 의미 검색
├── domains/ # 분야별 도구(생물학, 물리학 등)
├── safety/ # 보안 검사 및 검증
└── cli/ # 명령줄 인터페이스
tests/
├── unit/ # 단위 테스트
├── integration/ # 통합 테스트
└── e2e/ # 엔드 투 엔드 테스트
docs/
├── kosmos-figures-analysis.md # kosmos-figures의 분석 모드
├── integration-plan.md # 통합 전략
└── domain-roadmaps/ # 분야별 가이드
개발 및 테스트
# 개발 의존성 설치
pip install -e ".[dev]"
# 모든 테스트 실행
pytest
# 커버리지 테스트 실행
pytest --cov=kosmos --cov-report=html
# 특정 테스트 스위트 실행
pytest tests/unit/
pytest tests/integration/
pytest tests/e2e/
# 코드 포맷팅
black kosmos/ tests/
# 코드 검사
ruff check kosmos/ tests/
# 타입 검사
mypy kosmos/
개발 로드맵
✅ 완료(10개 단계)
단계 1: 프로젝트 기초 ✅
- 프로젝트 구조
- Claude 통합(API + CLI)
- 구성 시스템
- 에이전트 프레임워크
- 데이터베이스 설정
단계 2: 문헌 기능 ✅
- 문헌 API(arXiv, Semantic Scholar, PubMed)
- 문헌 분석 에이전트
- 의미 검색 벡터 데이터베이스
- 지식 그래프
단계 3: 가설 생성 ✅
- 가설 생성기 에이전트
- 신규성 확인
- 가설 우선순위 정렬
단계 4: 실험 설계 ✅
- 실험 설계자 에이전트
- 프로토콜 템플릿
- 리소스 추정
단계 5: 실험 실행 ✅
- 샌드박스 실행 환경
- kosmos-figures 패턴 통합
- 통계 분석
단계 6: 결과 분석 ✅
- 데이터 분석 에이전트
- 시각화 생성
- 결과 요약
단계 7: 연구 오케스트레이션 ✅
- 연구 책임자 에이전트
- 피드백 루프
- 수렴 감지
단계 8: 보안 및 검증 ✅
- 보안 검증
- 분야별 도구
단계 9: 생산 배포 ✅
- 성능 최적화(20-40× 향상)
- 다층 캐시 시스템
- 종합 테스트(90%+ 커버리지)
단계 10: 문서 및 완성 ✅
- 풍부한 문서(10,000+ 줄)
- 사용자 가이드
- API 문서
- 예제 코드
과학적 발견 사례
Kosmos는 여러 분야에서 검증된 과학적 발견을 만들어냈습니다:
1. 대사체학 - 뇌 저온 보호
미발표 원고의 발견을 독립적으로 재현하여, 저온 상태의 마우스 뇌에서 핵산 대사가 주요 변화 경로임을 확인했습니다.
2. 재료 과학 - 태양광 전지 효율
열 처리 중 습도가 태양광 전지 효율의 주요 결정 요소임을 발견하고, 임계 습도 임계값을 식별했습니다.
3. 신경과학 - 신경 네트워크 연결
종 간의 뇌 네트워크가 로그-노멀 패턴을 따르는 것으로 나타났습니다.
4. 심장 질환 - SOD2 보호 인자
SOD2 단백질이 섬유화를 줄여 심장을 보호하는 것으로 나타났습니다.
5. 당뇨병 - SSR1 유전자 변이
SSR1 유전자 근처의 유전자 변이가 2형 당뇨병에 대해 보호 효과가 있을 수 있음을 발견했습니다.
6. 알츠하이머병 - 시계열 분석 방법
질병의 뇌 세포에서 단백질의 시간 변화를 추적하는 새로운 분석 기법을 제안했습니다.
7. 신경퇴행성 질환 - 포스파티딜세린 노출
노화로 인해 플립라제 발현이 감소하여 신경 세포가 "먹어주세요" 신호를 노출함을 확인했습니다.
연구 효율성: 독립적인 과학자들이 Kosmos 보고서의 79.4%의 진술이 정확하다고 보고했으며, 협력자는 단일 20회 순환 Kosmos 실행이 그들 자신의 6개월 연구 시간과 동등하다고 보고했습니다.
영감의 원천
이 프로젝트는 다음과 같은 작업에서 영감을 받았습니다:
- 논문: Kosmos: An AI Scientist for Autonomous Discovery (2025년 11월)
- 분석 모드: kosmos-figures 저장소
- Claude Router: claude_n_codex_api_proxy
기여 가이드
기여를 환영합니다! CONTRIBUTING.md 참조.
환영받는 기여 영역:
- 분야별 도구 및 API
- 다양한 분야의 실험 템플릿
- 문헌 API 통합
- 보안 검증
- 문서
- 테스트
라이선스
MIT License - LICENSE 참조
인용
Kosmos를 연구에서 사용했다면, 다음을 인용하세요:
@software{kosmos_ai_scientist,
title={Kosmos AI Scientist: Multi-Provider Autonomous Scientific Discovery},
author={Kosmos Contributors},
year={2025},
url={https://github.com/jimmc414/Kosmos}
}
감사의 말
- Anthropic: Claude 및 Claude Code 제공
- Edison Scientific: kosmos-figures 분석 모드 제공
- 오픈 과학 커뮤니티: 문헌 API 및 도구 제공
지원 및 커뮤니티
- Issues: GitHub Issues
- 토론: GitHub Discussions
프로젝트 상태
상태: 생산 준비 완료 (v0.2.0) - 모든 10개 개발 단계 완료
최종 업데이트: 2025-11-07
문서 자원
- 아키텍처 개요 - 시스템 설계 및 구성 요소
- 통합 계획 - kosmos-figures 패턴 통합 방법
- 분야별 로드맵 - 분야별 구현 가이드
- API 참조 - API 문서
- 기여 가이드 - 기여 방법
핵심 장점 요약
- 완전 자율: 가설부터 발견까지의 엔드 투 엔드 자동화
- 다양한 분야 지원: 생물학, 물리학, 화학 등 여러 분야 지원
- 검증됨: 7개의 검증된 과학적 발견 생성
- 비용 최적화: 다층 캐시를 통해 30-40% 비용 절감
- 유연한 통합: API와 CLI 두 가지 방식 지원
- 보안 및 신뢰성: 샌드박스 실행, 검증 메커니즘, 90%+ 테스트 커버리지
- 생산 준비: v0.2.0 버전, 모든 개발 단계 완료