Simple Listeningを使用してオーディオ/ビデオからテキストへの変換を完了するには、以下の標準化された手順が必要です:
- ファイルのアップロードtingji.baidu.comウェブサイトの「ファイルをアップロード」ボタンをクリックし、MP3/WAV/MP4形式(最大2GB)をサポートします。
- 言語設定コンテンツに応じて主な認識言語を選択し、言語が混在するコンテンツでは「多言語認識」オプションをオンにします。
- インテリジェント・トランスクリプションスタートボタンをクリックすると、ファイルの長さに応じて文字起こしが行われます。
- 結果処理編集インターフェイスの認識エラーを修正し、キーワードのハイライト、段落の再編成などをサポート。
- 輸出共有TXT/DOC/PDFフォーマットへの最終エクスポート、または5GBのクラウド空き容量に直接保存。
特別な注意が必要だ:
- サンプリングレート16kHz以上のクリアな音声をアップロードすることを推奨します。
- バックグラウンドノイズが50dBを超える場合は、事前のノイズリダクションを推奨する。
- 用語の多いコンテンツは、まずシソーラスにアップロードして精度を高めることができる。
この答えは記事から得たものである。シンプル・リスニング・ノート:バイドゥの音声・動画テキスト化とAI要約ツールについて































