카르파티의 오토리서치, 당신이 잠든 동안 AI 에이전트가 머신러닝 연구 수행

March 08, 2026

안드레이 카르파티

3 min

뉴스 요약

2026년 3월 (미국 동부 시간) — 유명 AI 연구원이자 유레카 랩(Eureka Labs)의 설립자인 안드레이 카파시(Andrej Karpathy)가 GitHub에 autoresearch라는 새로운 오픈 소스 프로젝트를 공개했습니다. 2026년 3월에 발표된 이 프로젝트는 단일 GPU에서 머신러닝 실험을 자율적으로 실행하는 AI 에이전트를 책임자로 두어, 밤샘 실행 동안 실험 루프에서 인간 연구원을 효과적으로 대체합니다.

autoresearch란 무엇인가?

개념은 매우 간단합니다. AI 에이전트에게 작지만 완벽하게 작동하는 대규모 언어 모델(LLM) 훈련 환경을 제공하고 독립적으로 반복하도록 합니다. 에이전트는 훈련 코드를 수정하고, 5분간 실험을 실행하며, 검증 지표에서 성능이 향상되었는지 확인한 후 변경 사항을 유지하거나 폐기합니다. 이 주기를 밤새 반복합니다. 아침이 되면 사용자는 완료된 실험 로그와 이상적으로는 의미 있게 개선된 모델을 발견하게 됩니다.

이 프로젝트는 카파시의 이전 작업인 nanochat 위에 구축되었습니다. nanochat은 단일 GPU LLM 훈련 구현입니다. 코드베이스는 의도적으로 최소화되었습니다. 단 세 개의 파일만이 중요합니다. prepare.py는 데이터 준비 및 유틸리티를 처리하며 에이전트가 전혀 건드리지 않습니다. train.py는 에이전트가 모델 아키텍처 및 하이퍼파라미터부터 옵티마이저 및 배치 크기까지 자유롭게 수정하는 유일한 파일입니다. program.md는 인간 연구원이 에이전트의 행동을 안내하기 위해 작성한 Markdown 형식의 지침 파일로, 효과적으로 "연구 조직 사양" 역할을 합니다.

고정 시간 예산: 영리한 핵심 설계

autoresearch에서 가장 주목할 만한 설계 결정 중 하나는 각 실험에 대한 엄격한 5분 벽시계 시간 예산입니다. 에이전트가 모델 크기, 배치 크기, 아키텍처 등 무엇을 변경하든 모든 실행은 정확히 5분이 소요됩니다. 이는 시간당 약 12개의 실험과 하룻밤 동안 약 100개의 실험을 가능하게 합니다.

이점은 모든 실행이 부동 소수점 컴퓨팅이 아닌 동일한 시간 예산으로 경쟁하기 때문에 직접 비교 가능하다는 것입니다. 단점은 결과가 플랫폼별이라는 것입니다. NVIDIA H100에서의 실행은 다른 GPU에서의 실행과 비교할 수 없습니다. 평가 지표는 val_bpb(validation bits per byte)로, 어휘 크기와 독립적인 측정 방식으로 에이전트가 모델 아키텍처를 변경하더라도 공정한 비교를 보장합니다.

최소한의 종속성, 최대의 자율성

카파시는 PyTorch와 소수의 작은 패키지 외에 외부 인프라 종속성 없이 프로젝트를 자체 포함 상태로 유지했습니다. 분산 훈련, 복잡한 구성 시스템 또는 클라우드 요구 사항이 없습니다. 단일 NVIDIA GPU, Python 3.10 이상 및 uv 패키지 관리자만 있으면 됩니다.

자율 연구 모드에 진입하려면 사용자는 Claude, Codex 또는 기타 AI 에이전트를 리포지토리로 지정하고 program.md를 읽고 실험을 시작하도록 지시하기만 하면 됩니다. 카파시는 program.md 파일이 "매우 가벼운 기술"이며 연구 의도를 프로그래밍하기 위한 일반 텍스트 인터페이스라고 언급합니다.

커뮤니티 반응 및 초기 모멘텀

출시 이후 리포지토리는 상당한 커뮤니티의 관심을 끌었으며, 2026년 3월 초 현재 GitHub에서 1,800개 이상의 별과 200개의 포크를 획득했습니다. macOS 호환 변형을 포함하여 여러 커뮤니티 주도 포크가 이미 등장했습니다. 프로젝트는 출시 후 며칠 만에 20개의 커밋과 활성 이슈가 제출되어 개발자의 높은 관심을 보여주었습니다.

연구의 미래 엿보기

카파시는 특유의 재치 있는 철학적 프레임으로 프로젝트를 동반하며 다음과 같이 썼습니다. "언젠가 최첨단 AI 연구는 먹고, 자고, 다른 즐거움을 누르는 사이에 육체 컴퓨터에 의해 수행되었습니다... 그 시대는 오래전에 끝났습니다." 농담조의 발언이지만, 이 문장은 AI 커뮤니티가 자동화된 연구 파이프라인과 에이전트 주도 과학적 발견에 대해 생각하기 시작하는 방식의 광범위한 변화를 반영합니다.