Xiaozhi Clientは、Flutterフレームワークに基づいて開発されたクロスプラットフォームのAIアシスタントアプリで、Android、iOS、Web、Windows、macOS、Linuxなどの複数のプラットフォームをサポートしている。WebSocket技術によってリアルタイムの音声対話とテキスト対話を実現しており、ユーザーはいつでもどこでもAIアシスタントとコミュニケーションをとることができる。このプロジェクトはGitHubでホストされ、開発者のshenjingnanによって管理されており、xiaozhi (xiaozhi-server)エコシステムに基づいており、柔軟なサービス構成とマルチプラットフォームのサポートを提供する。このクライアントは、音声認識、テキスト対話、スマートデバイス制御など、様々なAIサービスプロバイダに対応しており、個人ユーザーや開発者に適している。インターフェースはシンプルかつスムーズで、暗い色や明るい色のテーマにも適応し、ユーザーに便利なインタラクティブ体験を提供する。
機能一覧
- リアルタイム音声対話:ユーザーがAIアシスタントと音声で対話することをサポートし、エコーキャンセル機能と音声中断機能を搭載。
- テキスト対話:スムーズなテキスト入出力を提供し、素早い問い合わせや複雑な対話に適しています。
- マルチプラットフォームのサポート:1つのコードセットがAndroid、iOS、Web、Windows、macOS、Linuxで動作します。
- サービス構成管理:複数のXiaozhiサービス・アドレス、WebSocket URL、トークン認証、カスタムMACアドレスの構成をサポート。
- Difyサービスの統合:APIキーとサーバーURLを管理するために、複数のDifyサービスの設定をサポートします。
- モデル選択とパラメータ調整:OpenAIインターフェース、Qwen3モデル切り替え思考モード、温度などのパラメータ設定をサポート。
- ダーク/ライトテーマ:ユーザーエクスペリエンスを向上させるために異なる表示モードを適応させます。
- 強化された音声認識:音声認識の精度を最適化し、テキストと音声の混在した会話をサポートします。
- OTA自動登録:デバイスの自動登録をサポートし、展開プロセスを簡素化します。
- スマートデバイス制御:MIot機能を統合し、Mi Homeデバイスの制御をサポート。
- Live2Dモデル切り替え: フリーのLive2Dモデルを内蔵し、フリーインポートとマルチモデル切り替えをサポート。
- 革新的なムード・モード:ユーザーの気分に合わせてインタラクションを調整し、パーソナライズされた体験を強化します。
ヘルプの使用
設置プロセス
XiaozhiクライアントはFlutterをベースに開発されており、アプリケーションの実行やビルドにはFlutter環境をインストールする必要がある。以下は詳しいインストール手順だ:
- Flutter環境のインストール
- Flutterの公式ウェブサイトにアクセスし、Flutter SDKをダウンロードしてインストールする(Windows、macOS、Linuxに対応)。
- コマンドラインが実行できるように環境変数を設定する。
flutter
命令だ。 - うごきだす
flutter doctor
環境が正しく設定されていることを確認し、不足している依存関係(Android SDKやXcodeなど)をインストールする。
- クローンプロジェクト
- ターミナルを開き、以下のコマンドを実行してXiaozhiクライアントコードをクローンする:
git clone https://github.com/shenjingnan/xiaozhi-client.git
- プロジェクト・カタログにアクセスする:
cd xiaozhi-client
- ターミナルを開き、以下のコマンドを実行してXiaozhiクライアントコードをクローンする:
- 依存関係のインストール
- プロジェクトディレクトリで以下のコマンドを実行して、必要なFlutterの依存関係をインストールする:
flutter pub get
- プロジェクトディレクトリで以下のコマンドを実行して、必要なFlutterの依存関係をインストールする:
- アプリケーションの実行
- デバイス(Android/iOSエミュレーターまたは実機)を接続し、以下のコマンドを実行してアプリを起動する:
flutter run
- アプリはデバッグモードで実行され、その結果はデバイス上で見ることができる。
- デバイス(Android/iOSエミュレーターまたは実機)を接続し、以下のコマンドを実行してアプリを起動する:
- リリースの構築
- Androidデバイス用のAPKをビルドする:
flutter build apk --release
- iOSデバイス用のIPAをビルドする(macOS上で動作する必要がある):
flutter build ios --release
- ウェブプラットフォーム用に構築されています:
flutter build web --release
- 注:iOSのコンパイルが完了したら、デバイスの設定でネットワークパーミッションを有効にする必要があります。
- Androidデバイス用のAPKをビルドする:
主要機能の使用
Xiaozhiクライアントのコア機能は音声とテキスト対話であり、以下は詳細な操作手順である:
- 音声対話
- アプリを開き、メインインターフェースのマイクアイコンをタップして音声モードに入ります。
- デバイスに向かって話すと、クライアントが音声を認識し、リアルタイムでテキストに変換する。
- AIアシスタントは、入力された内容に基づいて音声またはテキストによる応答を生成する。
- ノイズの多い環境では、認識精度を上げるためにエコーキャンセレーションを有効にしてください(設定でオンにします)。
- 音声中断機能をサポート:対話中にいつでも「ストップ」または「言い直し」と言って、現在の返答を中断し、再入力することができます。
- テキスト対話
- メイン画面の入力ボックスに質問や指示を入力し、「送信」ボタンをクリックします。
- AIアシスタントはテキスト回答を素早く生成し、複雑な質問への回答や複数回の対話をサポートする。
- テキストモードと音声モードを混在させることができる。例えば、音声で質問し、テキストの返事を見ることができる。
- サービス構成管理
- 設定ページに移動し、シウチーサービスのアドレス(WebSocket URL)を追加します。
- サーバーへの安全な接続を確保するため、認証用のトークンを入力します。
- APIキーとサーバーURLを入力し、希望するAIモデル(OpenAIやQwen3など)を選択することで、複数のDifyサービスを設定することができます。
- 反応の創造性や正確さをコントロールするためのモデルパラメータ(温度など)の調整。
- インテリジェント・デバイス制御
- Miデバイス(スマートライトやエアコンなど)を接続するには、「設定」でMIot機能を有効にします。
- 音声コマンド(例:「リビングルームの電気をつけて」)またはテキスト入力でデバイスを操作する。
- デバイスとクライアントが同じネットワーク環境にあることを確認してください。
- Live2Dモデル切り替え
- アプリには2つの無料Live2Dモデルが内蔵されており、設定ページで切り替えることができる。
- カスタムLive2Dモデルのインポートがサポートされています:モデルファイルを指定のディレクトリに置き(ドキュメントを参照)、設定で選択します。
- ダイアログとともにモデルが動的に表示され、インタラクティブな楽しさを高める。
- テーマの切り替え
- 異なる照明環境に合わせて、設定でダークまたはライトのテーマを選択します。
- テーマの切り替えはリアルタイムで反映されるため、アプリを再起動する必要はありません。
- ムード・モード
- ムードモードをオンにすると、AIはユーザーが入力した感情的なキーワード(例えば「幸せ」や「疲れ」など)に応じて返答のトーンを調整する。
- 例えば、あなたが「今日は疲れた」と言えば、AIは優しい口調で返答し、ユーザー体験を向上させる。
ほら
- ネットワークが安定しており、音声対話にはサーバーへのリアルタイム接続が必要であることを確認する。
- iOSユーザーは、初回起動時にマイクとネットワークの許可を与える必要があります。
- GitHubリポジトリのアップデートを定期的にチェックして、最新の機能と修正を入手しよう。
- Difyのサービスを利用する場合は、事前にDifyのプラットフォームに登録し、APIキーを取得する必要があります。
アプリケーションシナリオ
- アシスタント
ユーザーはXiaozhiクライアントで天気をチェックしたり、リマインダーを設定したり、質問に答えたりできる。例えば、忙しいオフィスワーカーは、スケジュールを素早くチェックしたり、音声コマンドで自宅のスマートデバイスを操作したりできる。 - 学習支援
学生はテキスト対話機能を使ってAIに学術的な質問をし、詳細な回答を得ることができる。OpenAIインターフェースをサポートするグラフィック対話機能は、複雑な文書や画像の分析に適しています。 - スマート・ホーム・コントロール
エアコンをつけたり、照明を調整したりといったMi Homeのデバイスを音声やテキストで操作することができ、スマートな住環境の構築に適している。 - 開発者のデバッグ
開発者は、サービス構成機能を使用して、さまざまなAIモデルやパラメータをテストし、WebSocket接続やDifyサービスの統合効果を迅速に検証することができます。
品質保証
- Xiaozhiクライアントはどのプラットフォームをサポートしていますか?
Android、iOS、Web、Windows、macOS、Linuxをサポートし、複数のプラットフォームに適応したコード群であるFlutter開発を使用している。 - 音声認識の精度を上げるには?
静かな環境で使用し、エコーキャンセリングをオンにし、設定で高品質の音声認識モデルを選択します。 - サーバーのサポートは必要ですか?
xiaozhi-serverまたはDifyサービスに接続し、正しいWebSocket URLとAPIキーを設定する必要があります。 - Live2Dのカスタムモデルをインポートするには?
モデルファイルをアプリケーション指定のディレクトリに置き(ドキュメントを参照)、インポートしたモデルを設定で選択します。 - 対応するAIモデルは?
OpenAI、Qwen3など多くのモデルをサポートし、ユーザーは設定でパラメータを選択して調整できる。