Zentrale Interaktionsfunktionen und Umschaltmechanismen
Der Xiaozhi-Client bietet zwei zentrale Interaktionsfunktionen:
- Sprachinteraktion in EchtzeitSpracherkennung und -synthese über WebSocket-Technologie, mit Unterstützung für Echounterdrückung, Sprachunterbrechung (ausgelöst durch Befehlswörter wie "Stopp") und Filterung von Umgebungsgeräuschen.
- textbasiertes DialogsystemAsynchroner Nachrichtenverarbeitungsmechanismus zur Unterstützung mehrerer Dialogrunden und Kontextpflege bei komplexen Problemen
Es gibt zwei Arten der Vermittlung:
- Proaktives SchaltenDie Hauptschnittstelle zeigt sowohl ein Mikrofonsymbol als auch ein Eingabefeld an, so dass der Benutzer jederzeit wählen kann, wie er interagieren möchte.
- Hybrid-ModellNachdem Sie eine Frage per Sprache gestellt haben, können Sie sich eine Textantwort anzeigen lassen oder mit dem Sprachbefehl "Umschalten auf Texteingabe" einen Wechsel auslösen. Das System merkt sich die bevorzugte Standard-Interaktionsmethode des Benutzers in den Einstellungen.
Diese Antwort stammt aus dem ArtikelXiaozhi MCP Client: ein plattformübergreifender KI-Assistent mit Sprach- und TextinteraktionDie