Derzeitige Position:Abb. Anfang " AI-Antworten

Was sind die wichtigsten Neuerungen in der Roadmap von Kokoro-ONNX für die Zukunft?

2025-09-10

3.0 K

Veröffentlichte Entwicklungspläne

Aus den Projektunterlagen und den Interviews mit den Entwicklern geht hervor, dass der Schwerpunkt auf den nächsten sechs Monaten liegen wird:

SpracherweiterungFranzösisch/Japanisch-Unterstützung bis Q3 2024, Chinesisch-Mandarin und Koreanisch ab Q4
EmotionsmotorHinzufügen der Steuerung von 8 Emotionsparametern wie Wut, Traurigkeit usw. (Beta-Version wurde intern getestet)
Hardware-BeschleunigungProprietäre Optimierungen für NVIDIA Tensor Core und Intel OpenVINO

In der Open-Source-Gemeinschaft werden unter anderem folgende Vorschläge für Funktionen diskutiert:

Unterstützung von DialektenKantonesisch, Kansai-Japanisch und andere regionale Varianten
Klonen von StimmabdrückenErlauben Sie Benutzern, Sprachproben für die Merkmalsextraktion hochzuladen.
Cloud-KollaborationHybride Inferenzverfahren für lokale Modelle und große Modelle in der Cloud

Es ist geplant, einen Voice-Style-Marktplatz (Voice Marketplace) einzurichten, um Entwicklern die Möglichkeit zu geben: