安装realtime-transcription-fastrtc需要完成以下步骤:
システム環境の準備
- 确保Python ≥3.10已安装
- 安装ffmpeg用于音频处理(macOS可通过brew,Linux通过apt,Windows需手动配置)
- 推荐使用GPU加速(MPS或CUDA),CPU也可运行但性能较低
项目部署流程
- クローン倉庫
git clone https://github.com/sofi444/realtime-transcription-fastrtc
- 创建虚拟环境:推荐使用uv工具(或传统pip方式)
- インストールに必要なもの: run
uv pip install -r requirements.txt
或对应pip命令
- 配置.env文件:设置UI_MODE、APP_MODE、MODEL_ID等关键参数
キーコンフィギュレーションの説明
- UI_MODE:gradio(简易界面)或fastapi(可定制界面)
- MODEL_ID:默认使用openai/whisper-large-v3-turbo,可更换为其他Hugging Face模型
- 港:服务运行端口,默认7860
- 确保Python ≥3.10已安装
- 安装ffmpeg用于音频处理(macOS可通过brew,Linux通过apt,Windows需手动配置)
- 推荐使用GPU加速(MPS或CUDA),CPU也可运行但性能较低
项目部署流程
- クローン倉庫
git clone https://github.com/sofi444/realtime-transcription-fastrtc
- 创建虚拟环境:推荐使用uv工具(或传统pip方式)
- インストールに必要なもの: run
uv pip install -r requirements.txt
或对应pip命令
- 配置.env文件:设置UI_MODE、APP_MODE、MODEL_ID等关键参数
キーコンフィギュレーションの説明
- UI_MODE:gradio(简易界面)或fastapi(可定制界面)
- MODEL_ID:默认使用openai/whisper-large-v3-turbo,可更换为其他Hugging Face模型
- 港:服务运行端口,默认7860
- クローン倉庫
git clone https://github.com/sofi444/realtime-transcription-fastrtc
- 创建虚拟环境:推荐使用uv工具(或传统pip方式)
- インストールに必要なもの: run
uv pip install -r requirements.txt
或对应pip命令 - 配置.env文件:设置UI_MODE、APP_MODE、MODEL_ID等关键参数
キーコンフィギュレーションの説明
- UI_MODE:gradio(简易界面)或fastapi(可定制界面)
- MODEL_ID:默认使用openai/whisper-large-v3-turbo,可更换为其他Hugging Face模型
- 港:服务运行端口,默认7860
- UI_MODE:gradio(简易界面)或fastapi(可定制界面)
- MODEL_ID:默认使用openai/whisper-large-v3-turbo,可更换为其他Hugging Face模型
- 港:服务运行端口,默认7860
完成配置后,执行python main.py
启动服务,通过浏览器访问终端显示的URL即可使用。
この答えは記事から得たものである。リアルタイム音声テキスト化のためのオープンソースツールについて