用語翻訳の精度を高める方法
Hibikiの基本モデルは、汎用的な言語シナリオには最適化されていますが、専門用語には十分な精度が得られない場合があります。次の解決策は、これを大幅に改善することができる:
- カスタム・シソーラスの作成MADLADシステムを使って、特定のフレーズに対してアラインメント関係を強制する、ドメイン固有の対訳コンコーダンステーブルを構築する。
- モデルの微調整対象領域のデータで10~20エポック学習を継続し、項密度の高いサンプルに注目する。
- 後処理置換翻訳されたテキストを入手した後、ルール・エンジンを使ってキーワードを置き換える。
- コンテクストセンシティブ音声入力の前にドメイン・キュー・ワードを追加すると、モデルが文脈を理解しやすくなります。
- 人的介入による修正システムへフィードバックするために、誤訳のサンプルを記録するヒューマン・イン・ザ・ループ機構を導入する。
響の合成データ生成技術は、特殊なドメインデータの拡張に特に適している。少数の実際の対話(例えば20時間の医療相談)を収集することにより、100時間以上の拡張学習データを生成することができる。このアプローチにより、金融や法律の実験において、専門用語の精度が40%向上することが示されている。
この答えは記事から得たものである。Hibiki:リアルタイム音声翻訳モデル、元の音声の特徴を保持したストリーミング翻訳について































