オフライン環境で音声合成を行うには、Spokenlyのネイティブ機能であるWhisperモデルの使用をお勧めします。手順は以下の通りです:
- Spokenlyの設定で'Speech Model'を選択し、'Local Whisper Model'オプションに切り替えます。
- デバイスが最小構成要件(macOS 12.0以上、8GB RAM推奨)を満たしていることを確認してください。
- 認識精度を向上させるには、静かな環境で質の良いマイクを使用し、明瞭な発声を第一の基準としてください。
- 特殊な用語や特殊な語彙については、AIプロンプトに置換ルールを事前に設定することができる(「CRMを顧客関係管理システムに置き換える」など)。
ローカルモデルは句読点処理が弱いので、後の段階で手動で追加するか、AIプロンプト・ルール(「ピリオドを.に変換する」など)を設定することで追加できる。を設定して出力を最適化することができる。
この答えは記事から得たものである。Spokenly:macOS用音声テキスト変換ツールについて