Spokenlyは、中国語と英語が混在するような多言語シナリオのためのインテリジェントなソリューションを提供します:
- 自動言語検出』機能を有効にすると(デフォルトはオン)、システムは自動的に言語スイッチを認識します。
- 専門的なシナリオでは、クラウドベースの高度なモデル(GPT-4oなど)が優先され、その多言語ハイブリッド認識精度は、ローカルモデルよりも30%以上高い。
- 特定の言語の認識にずれがある場合、一時的に支配的な言語を強制的に指定することができます:設定 > 言語で自動検出をオフにし、支配的な言語を手動で選択します。
- 重要な用語については、音声入力中に短いポーズを入れたり、音量を上げたりすることで、システムが言語の移行点をより正確に認識できるようになる。
実証テストによると、クラウドモデルは中国語と英語の混在した発話を最大92%の精度で認識することができ、これは国際会議の議事録のような専門的なシナリオに適している。
この答えは記事から得たものである。Spokenly:macOS用音声テキスト変換ツールについて