専門的なシーン認識は、文脈パラメータによって大幅に改善することができる:
- 最初のプロンプトを追加する。
?initial_prompt=医学术语
現場のキーワード - プレフィックス改正テキストの既知の部分の使用
&prefix=患者主诉:
その後のコンテンツの特定につながる - VAD濾過イネーブル
vad_filter=true
バックグラウンドノイズの干渉を排除 - バイリンガリズム言語が混在するコンテンツの設定
task=translate&language=en
強制翻訳
テストによると、この方法によって医学用語の認識精度が37%向上した。
この答えは記事から得たものである。ウィスパー・オン・クラウドフレアAI:音声をテキストに変換し、字幕を生成する無料ツールについて