AI-Chatboxの主な機能は以下の通り:
- ウェイク・トゥ・ボイス&コマンド認識ハイ、レクシン」というウェイクアップワードと、「質問があります」というコマンドワードをトリガーとした録画に対応。
- 音声テキスト中国語認識に対応したVoskツールを使って、録音したWAV音声をテキストに変換。
- 大型モデルの相互作用テキストで質問を送信し、DeepSeek APIを介してスマートな回答を得ることができます。
- ロギングデバイスの状態、認識結果、LLM回答をリアルタイムで記録し、デバッグを容易にします。
- クロスデバイスアクセスFlaskを使ってRESTサービスを構築し、LAN上の他のデバイスが音声読み上げ機能を呼び出せるようにする。
- 組み込み最適化Rustで開発され、ESP32S3ハードウェアに最適化され、パフォーマンスとリソースのバランスを取るために最大512個のトークンが生成されるように設定されています。
この答えは記事から得たものである。AI-Chatbox:ESP32S3ベースの音声テキストインテリジェント対話プロジェクトについて