Mehrsprachige Erkennungslösungen
Obwohl das Tool standardmäßig für Englisch optimiert ist, kann die Sprachunterstützung auf folgende Weise erweitert werden:
- Modellwechsel::
- Im GitHub-Repository wird die
requirements.txtdurch ein Spracherkennungsmodell ersetzt, das die Mehrsprachigkeit unterstützt (z. B. Whisper), in der - Ändern Sie den Modellladecode in main.py
- Im GitHub-Repository wird die
- Zwischenprogramm::
- Verwenden Sie die systemeigene Diktierfunktion (zu aktivieren in Systemeinstellungen → Tastatur → Diktat)
- Erstellen eines Workflows zur Überbrückung von Systemdiktat und Zwischenablage über Automator
caveat
Eine Änderung des Codes ist erforderlich:
- Grundkenntnisse in Python
- Sicherstellen, dass das neue Modell mit dem MLX-Rahmen kompatibel ist
- Beachten Sie die Unterschiede in der Zeichensatzbehandlung zwischen den Sprachen
Chinesischen Benutzern wird empfohlen, vorrangig die Wirkung des automatischen Einfügens von Satzzeichen zu testen.
Diese Antwort stammt aus dem ArtikelVery Fast Dictation: ein schnelles Sprache-zu-Text-Tool für MACsDie































