xiaozhi-esp32-serverを使ってESP32デバイスと音声対話を行うには？

2025-08-29

2.6 K

音声対話機能を実装するには、以下の主要なステップを完了する必要があります：

環境準備Python3.10とCondaをインストールし、4コアCPU/8GB RAMのハードウェア環境を構築します。
プロジェクト展開GitHubからソースコードをダウンロードしたら、Condaで専用の仮想環境を作成し、libopus、ffmpeg、その他の依存ライブラリをインストールする。
モデル構成SenseVoiceSmall/model.ptファイルが含まれていることを確認してください。
ダイアログ設定config.yamlの調整min_silence_duration_msパラメータ（1000ms推奨）は、ダイアログの応答感度を制御する
相互作用方式::
- ボイスウェイクアップ：あらかじめ設定したウェイクアップワードでデバイスを起動
- マニュアル・トリガー：物理的なボタンを使って対話を始める
- リアルタイム中断：スピーチの途中で現在の応答を中断することができます。

実際のテストでは、"Hello "などのテスト文を言うことでインタラクションリンクを確認することができ、システムはデフォルトで中国語/英語/日本語/韓国語の言語認識をサポートしています。応答が遅れる場合は、AliLLM+DoubaoTTSの組み合わせで性能を向上させることができます。

クイック照会ステーションAIツール