realtime-transcription-fastrtcをインストールするには、以下の手順が必要です:
システム環境の準備
- Python ≥3.10 がインストールされていることを確認する。
- 音声処理用にffmpegをインストールする(macOSはbrew経由、Linuxはapt経由、Windowsは手動設定が必要)
- GPUアクセラレーション(MPSまたはCUDA)を推奨。
プロジェクト展開プロセス
- クローン倉庫
git clone https://github.com/sofi444/realtime-transcription-fastrtc
- 仮想環境の作成:uvツールを推奨(または伝統的なpipの方法)
- インストールに必要なもの: run
uv pip install -r requirements.txtまたは対応するpipコマンド
- Configuration.envファイル:UI_MODE、APP_MODE、MODEL_ID、その他の主要なパラメータを設定します。
キーコンフィギュレーションの説明
- UI_MODE:: gradio (シンプルなインターフェース) または fastapi (カスタマイズ可能なインターフェース)
- モデルIDopenai/whisper-large-v3-turboはデフォルトで使用されています。
- 港サービス実行ポート、デフォルト7860
- Python ≥3.10 がインストールされていることを確認する。
- 音声処理用にffmpegをインストールする(macOSはbrew経由、Linuxはapt経由、Windowsは手動設定が必要)
- GPUアクセラレーション(MPSまたはCUDA)を推奨。
プロジェクト展開プロセス
- クローン倉庫
git clone https://github.com/sofi444/realtime-transcription-fastrtc
- 仮想環境の作成:uvツールを推奨(または伝統的なpipの方法)
- インストールに必要なもの: run
uv pip install -r requirements.txtまたは対応するpipコマンド
- Configuration.envファイル:UI_MODE、APP_MODE、MODEL_ID、その他の主要なパラメータを設定します。
キーコンフィギュレーションの説明
- UI_MODE:: gradio (シンプルなインターフェース) または fastapi (カスタマイズ可能なインターフェース)
- モデルIDopenai/whisper-large-v3-turboはデフォルトで使用されています。
- 港サービス実行ポート、デフォルト7860
- クローン倉庫
git clone https://github.com/sofi444/realtime-transcription-fastrtc - 仮想環境の作成:uvツールを推奨(または伝統的なpipの方法)
- インストールに必要なもの: run
uv pip install -r requirements.txtまたは対応するpipコマンド - Configuration.envファイル:UI_MODE、APP_MODE、MODEL_ID、その他の主要なパラメータを設定します。
キーコンフィギュレーションの説明
- UI_MODE:: gradio (シンプルなインターフェース) または fastapi (カスタマイズ可能なインターフェース)
- モデルIDopenai/whisper-large-v3-turboはデフォルトで使用されています。
- 港サービス実行ポート、デフォルト7860
- UI_MODE:: gradio (シンプルなインターフェース) または fastapi (カスタマイズ可能なインターフェース)
- モデルIDopenai/whisper-large-v3-turboはデフォルトで使用されています。
- 港サービス実行ポート、デフォルト7860
設定が完了したらpython main.pyサービスを起動し、端末に表示されたURLにブラウザでアクセスして利用する。
この答えは記事から得たものである。リアルタイム音声テキスト化のためのオープンソースツールについて
































