rany2/edge-ttsPlease refer to the latest official releases for information GitHub Homepage

Microsoft Edge 온라인 텍스트 음성 변환 서비스를 무료로 사용할 수 있는 Python 모듈입니다. Edge 브라우저, Windows 시스템 또는 API 키가 필요하지 않습니다.

LGPL-3.0Python 8.4krany2 Last Updated: 2025-05-03

Edge-TTS 프로젝트 상세 소개

프로젝트 개요

Edge-TTS는 Microsoft Edge 브라우저, Windows 시스템 또는 API 키 설치 없이 Microsoft Edge의 온라인 텍스트 음성 변환 서비스를 사용할 수 있도록 하는 강력한 Python 모듈입니다. 이 프로젝트는 개발자에게 Microsoft의 고품질 음성 합성 서비스에 액세스할 수 있는 간단하고 사용하기 쉬운 인터페이스를 제공합니다.

프로젝트 주소

GitHub 저장소: https://github.com/rany2/edge-tts

핵심 기능

1. 제로 구성 사용

Microsoft Edge 브라우저 불필요
Windows 운영체제 불필요
API 키 또는 계정 등록 불필요
완전 무료 사용

2. 다양한 사용 방식

명령줄 도구: edge-tts 및 edge-playback 명령
Python 모듈: Python 코드에서 직접 호출 가능
일괄 처리: 일괄 텍스트 음성 변환 지원

3. 풍부한 음성 선택

다양한 언어 및 지역 지원
남성 및 여성 음성 옵션 제공
다양한 음성 개성 및 스타일 포함

설치 방법

표준 설치

pip install edge-tts

pipx를 사용한 설치 (명령줄 도구에 권장)

pipx install edge-tts

기본 사용 방법

명령줄 사용

기본 텍스트 음성 변환

edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.srt

실시간 재생 (mpv 플레이어 필요)

edge-playback --text "Hello, world!"

사용 가능한 모든 음성 목록 표시

edge-tts --list-voices

특정 음성 사용

edge-tts --voice ar-EG-SalmaNeural --text "مرحبا كيف حالك؟" --write-media hello_in_arabic.mp3

음성 매개변수 조정

말하기 속도 조정

edge-tts --rate=-50% --text "Hello, world!" --write-media hello_slow.mp3

음량 조정

edge-tts --volume=-50% --text "Hello, world!" --write-media hello_quiet.mp3

음조 조정

edge-tts --pitch=-50Hz --text "Hello, world!" --write-media hello_low_pitch.mp3

지원되는 언어 및 지역

Edge-TTS는 다음을 포함하되 이에 국한되지 않는 많은 언어 및 지역 변형을 지원합니다.

아랍어: 여러 지역 변형 (이집트, 아랍에미리트, 바레인 등)
중국어: 간체 중국어, 번체 중국어 등
영어: 미국식, 영국식, 호주식 등 다양한 억양
프랑스어: 프랑스, 캐나다 등
독일어: 독일, 오스트리아 등
일본어: 일본
한국어: 한국
스페인어: 스페인, 멕시코, 아르헨티나 등
기타: 아프리칸스어, 암하라어 등 소수 언어 포함

Python 프로그래밍 인터페이스

Edge-TTS는 Python 모듈로 코드에서 직접 사용할 수 있으며 다양한 애플리케이션에 통합하는 데 적합합니다.

기술적 특징

1. 출력 형식

오디오 파일: MP3 형식 출력 지원
자막 파일: SRT 형식 자막 지원, 동기화된 표시 용이

2. SSML 지원 제한

Microsoft의 보안 제한으로 인해 사용자 정의 SSML 기능이 제거되었습니다. 서비스는 Microsoft Edge 자체에서 생성할 수 있는 SSML 형식만 사용할 수 있습니다. 즉, 단일 <voice> 태그와 그 안의 단일 <prosody> 태그만 지원합니다.

3. 매개변수 제어

말하기 속도 제어: --rate 매개변수를 통해 조정
음량 제어: --volume 매개변수를 통해 조정
음조 제어: --pitch 매개변수를 통해 조정

활용 시나리오

1. 콘텐츠 제작

팟캐스트 제작
비디오 더빙
오디오북 제작

2. 접근성 애플리케이션

웹 페이지 내용 읽기
문서 음성화
시각 장애인 보조 도구

3. 교육 훈련

언어 학습 자료
온라인 강좌 더빙
발음 예시 생성

4. 자동화 애플리케이션

스마트 어시스턴트 음성 피드백
알림 시스템 음성 방송
일괄 콘텐츠 처리

장점 요약

완전 무료: 비용 지불 불필요
고품질 음성: Microsoft의 고급 음성 합성 기술 기반
간단하고 사용하기 쉬움: 설치 및 사용이 매우 간단
크로스 플랫폼: Linux, macOS, Windows 지원
다국어: 전 세계 주요 언어 지원
오픈 소스: 코드 오픈 소스, 자유로운 수정 및 배포 가능
활발한 유지 관리: 프로젝트 지속적인 업데이트 및 유지 관리

주의 사항

네트워크 의존성: Microsoft의 온라인 서비스에 액세스하려면 인터넷 연결 필요
재생 의존성: edge-playback 명령은 비 Windows 시스템에서 mpv 플레이어 설치 필요
서비스 제한: Microsoft 서비스 약관의 적용을 받으며 사용 빈도 제한이 있을 수 있음
SSML 제한: 복잡한 SSML 사용자 정의는 지원하지 않으며 기본 음성 매개변수 조정만 가능

요약

Edge-TTS는 매우 실용적인 텍스트 음성 변환 도구입니다. Microsoft Edge 브라우저의 온라인 TTS 서비스를 영리하게 활용하여 사용자에게 무료의 고품질 음성 합성 솔루션을 제공합니다. 개인적인 용도이든 프로젝트 통합이든 추천할 만한 도구입니다. 간단한 설치 및 사용 방법과 풍부한 언어 지원으로 인해 텍스트 음성 변환 요구 사항에 이상적인 선택입니다.