非言語的な表現を生み出すダイヤの能力は、対話の真正性を著しく高める。

2025-08-24

1.4 K

ディアにおける非言語表現の技術的ブレークスルー

Diaは、音声合成分野で初めて完全な非言語表現生成システムを実装した。このシステムは、特殊なテキストマーク認識技術により、笑い、間、ため息など、一般的な12の非言語的音声要素を正確に解析し、生成することができます。

技術的な実装は、階層的なニューラルネットワーク構造を使用している：

実際のテストによると、非言語表現の追加による人間の自然さスコア（MOS）の向上は23.7%に達し、類似製品のそれを大幅に上回った。代表的な応用例は以下の通り：

このため、Diaは忠実度の高い対話コンテンツを制作するのに最適なツールとなっている。