Whisper.cpp ist eine hochperformante C/C++-Portierung des OpenAI Whisper Automatic Speech Recognition (ASR)-Modells. Dieses Projekt implementiert das ursprünglich Python-basierte Whisper-Modell in reinem C/C++-Code neu und realisiert eine abhängigkeitsfreie und hocheffiziente Spracherkennung, die sich besonders für ressourcenbeschränkte Umgebungen und eingebettete Geräte eignet.
Modell | Speicherplatzbedarf | Speicherbedarf | Inferenzgeschwindigkeit | Genauigkeit |
---|---|---|---|---|
tiny | 75 MiB | ~273 MB | Am schnellsten | Grundlegend |
base | 142 MiB | ~388 MB | Schnell | Gut |
small | 466 MiB | ~852 MB | Mittel | Sehr gut |
medium | 1.5 GiB | ~2.1 GB | Langsamer | Ausgezeichnet |
large | 2.9 GiB | ~3.9 GB | Langsam | Optimal |
# Projekt klonen
git clone https://github.com/ggml-org/whisper.cpp.git
cd whisper.cpp
# Projekt kompilieren
cmake -B build
cmake --build build --config Release
# Modell herunterladen
./models/download-ggml-model.sh base.en
# Audio transkribieren
./build/bin/whisper-cli -f samples/jfk.wav -m models/ggml-base.en.bin
# Modell herunterladen
docker run -it --rm -v $(pwd)/models:/models \
ghcr.io/ggml-org/whisper.cpp:main \
"./models/download-ggml-model.sh base /models"
# Audio transkribieren
docker run -it --rm \
-v $(pwd)/models:/models \
-v $(pwd)/audio:/audio \
ghcr.io/ggml-org/whisper.cpp:main \
"whisper-cli -m /models/ggml-base.bin -f /audio/sample.wav"
Whisper.cpp ist eine äußerst ausgezeichnete Spracherkennungslösung, die das Whisper-Modell von OpenAI erfolgreich auf die C/C++-Plattform portiert hat und so eine hohe Leistung, einen geringen Ressourcenverbrauch und eine breite Plattformkompatibilität erreicht. Ob für die Entwicklung mobiler Anwendungen, eingebettete Systeme oder groß angelegte Serverbereitstellungen, whisper.cpp bietet zuverlässige und effiziente Spracherkennungsfunktionen.
Dieses Projekt eignet sich besonders für folgende Szenarien: