以下の技術的制約は、最適な使用を保証するために特別な注意が必要です:
- プラットフォーム制限現在のところ、YouTubeの公開動画にのみ対応しており、Vimeoや非公開動画は処理できません。
- 期間への影響::
- 5分以内のビデオ:字幕生成約30秒、ダビング約2分
- 30分のビデオ:処理時間は15~20分に延長可能
- コンテンツ要件::
- バックグラウンドノイズが40dB以下のクリアなオーディオソースの使用を推奨。
- 専門用語の多いビデオは、最初に用語集を提供することをお勧めします。
- 180語/分以上の発話は認識精度に影響を与える可能性があります。
- フォーマットの互換性::
- 出力字幕はSRT/VTT/TXTフォーマットに対応。
- ナレーション音声は現在MP3形式のみ。
最適化の提案:長い動画の場合、まず2分間のサンプルを処理して効果をテストし、エラーがないことを確認してから完全な動画を送信することができます。
この答えは記事から得たものである。ブイエスピーについて