MegaTTS3: Ein hochwertiges Zero-Shot-Sprachsynthesemodell, entwickelt von ByteDance, das das Klonen von chinesischen und englischen Stimmen unterstützt
Eine hochwertige, mehrsprachige Text-to-Speech-Bibliothek, entwickelt von MyShell.ai, die Englisch, Spanisch, Französisch, Chinesisch, Japanisch und Koreanisch unterstützt.
OpenVoice: Eine sofortige Sprachklontechnologie, die von MIT und MyShell gemeinsam entwickelt wurde und auf einem Audio-Basismodell basiert, um mehrsprachiges Stimmenklonen zu ermöglichen.
Unsloth: Hocheffizientes Feinabstimmungs- und Reinforcement-Learning-Tool für große Sprachmodelle - 2x schnellere Trainingsgeschwindigkeit, 70% weniger Speicherverbrauch
ChatTTS-ui: Eine einfache lokale Web-Oberfläche, die Text mit ChatTTS in Sprache umwandelt und gleichzeitig eine API-Schnittstelle zur externen Nutzung bereitstellt.
Spark-TTS: Ein effizientes Text-to-Speech-System basierend auf großen Sprachmodellen, das Zero-Shot-Sprachklonierung und kontrollierte Sprachgenerierung unterstützt.
Ein generatives Sprachmodell, das speziell für Dialogszenarien entwickelt wurde und die gemischte Eingabe von Chinesisch und Englisch sowie die Fähigkeit mehrerer Sprecher unterstützt.
Eine hochperformante C/C++-Portierung des OpenAI Whisper-Spracherkennungsmodells, die reine CPU-Inferenz und Multiplattform-Bereitstellung unterstützt.
OpenVINO™ ist ein Open-Source-Toolkit zur Optimierung und Bereitstellung von KI-Inferenz, das Deep-Learning-Anwendungen wie Computer Vision, automatische Spracherkennung, generative KI und Verarbeitung natürlicher Sprache unterstützt.
PowerInfer ist eine Hochgeschwindigkeits-Inferenz-Engine für große Sprachmodelle, die für die lokale Bereitstellung entwickelt wurde. Sie nutzt spärliche Aktivierung und eine hybride CPU/GPU-Architektur, um eine schnelle LLM-Inferenz auf Consumer-Hardware zu ermöglichen.
Der einfachste Weg, KI-Anwendungen und Modelldienste bereitzustellen - Erstellen Sie Modellinferenz-APIs, Aufgabenwarteschlangen, LLM-Anwendungen, Multi-Modell-Pipelines usw.
Die MCP-Datenbank-Toolbox ist ein Open-Source-MCP-Server zur Vereinfachung der Datenbanktool-Entwicklung, der Funktionen wie Verbindungspooling und Authentifizierung bietet.
Eine Modellkontextprotokoll (MCP) Serverimplementierung, die Chroma Datenbankfunktionen bereitstellt und KI-Datenabruffähigkeiten wie Vektorsuche, Volltextsuche und Metadatenfilterung unterstützt.