使用简单听记完成音视频转文字需要以下标准化操作流程:
- ファイルのアップロード:在tingji.baidu.com官网点击”上传文件”按钮,支持MP3/WAV/MP4等格式(最大2GB)
- 言語設定:根据内容选择主要识别语言,混语种内容需开启”多语言识别”选项
- インテリジェント・トランスクリプション:点击开始按钮后,系统会根据文件时长进行转写(一般1小时音频需3-5分钟)
- 結果処理:在编辑界面可修正识别错误,支持关键词高亮、段落重组等操作
- 輸出共有:最终可导出TXT/DOC/PDF格式,或直接保存至5GB免费云空间
需要特别注意:
- 建议上传16kHz以上采样率的清晰音频
- 背景噪音超过50dB时建议提前降噪处理
- 专业术语较多的内容可先上传术语库提升准确率
この答えは記事から得たものである。シンプル・リスニング・ノート:バイドゥの音声・動画テキスト化とAI要約ツールについて