OpenVoice는 MIT(매사추세츠 공과대학교)와 MyShell이 공동 개발한 오픈 소스 즉석 음성 복제 기술 프로젝트입니다. 이 프로젝트는 오디오 기반 모델을 기반으로 고품질의 다국어 음성 복제 및 합성을 구현할 수 있습니다. 2023년 5월부터 OpenVoice는 MyShell.ai 플랫폼에 즉석 음성 복제 기능을 제공해 왔으며, 2023년 11월 현재 전 세계 사용자들이 수천만 번 사용했습니다.
OpenVoice는 다음과 같은 우수한 오픈 소스 프로젝트를 기반으로 구축되었습니다.
기본 지원 언어 외에도 OpenVoice는 제로샷 학습 능력을 통해 다른 언어의 음성 복제 작업을 처리할 수 있습니다.
# 가상 환경 생성
conda create -n openvoice python=3.9
conda activate openvoice
# 프로젝트 복제
git clone https://github.com/myshell-ai/OpenVoice.git
cd OpenVoice
# 종속성 설치
pip install -e .
프로젝트는 완전한 Jupyter Notebook 데모를 제공합니다.
demo_part1.ipynb
: 유연한 음성 스타일 제어 시연demo_part2.ipynb
: 교차 언어 음성 복제 기능 시연프로젝트 연구 결과는 학술 논문 《OpenVoice: Versatile Instant Voice Cloning》에 발표되었으며, 기술 원리 및 실험 결과를 자세히 설명합니다.
OpenVoice는 현재 음성 복제 기술의 최첨단 수준을 나타내며, MIT와 MyShell의 공동 개발을 통해 전 세계 개발자와 연구자에게 강력하고 유연하며 무료인 음성 복제 솔루션을 제공합니다.