声紋認識と音声特徴分析技術を採用し、標準的な録音環境で95%以上の認識精度で、会議録音の異なる話者の対話内容を正確にマークすることができます。各スピーチ段落にはタイムスタンプが付与され、音声や映像と同期しているため、ユーザーはテキストをクリックすることで対応するスピーチ段落にジャンプすることができます。この機能は、最大10人まで同時に認識できる会議シナリオをサポートし、出力は法的に認識されたトランスクリプトとして直接使用できます。
この答えは記事から得たものである。VidText.ai:ビデオやオーディオをテキストやマインドマップに変換するAIツールについて