Verwendung von Sprachfunktionen erklärt
Die Sprachinteraktion von Dippy ist so konzipiert, dass sie ein echtes Telefonerlebnis mit folgendem Ablauf nachahmt:
Aktivierungsverfahren
Klicken Sie in der unteren rechten Ecke des Charakter-Chat-Bildschirms aufMikrofon-Symbol(Für die erstmalige Nutzung ist eine Autorisierung der Aufzeichnungsrechte erforderlich), schaltet die Schnittstelle in den Modus zur Visualisierung der Sprachrippel. Das System erkennt automatisch das Ende der Spracheingabe, so dass der Benutzer nicht manuell umschalten muss.
Tipps und Tricks
- Vorbereitung der UmweltEmpfohlen für den Einsatz in Umgebungen unter 60 dB, mit einer effektiven Entfernung von 30 cm.
- Sprachbefehl (für Computer-Spracherkennung)Unterstützung für natürliche Ausdrücke wie "einen Witz erzählen" und "das heutige Wetter".
- vielschichtiger DialogMaximal 90 Sekunden für jedes Sprachsegment, mit einem 2-Sekunden-Intervall für die automatische Beantwortung.
Technische Merkmale
End-to-End-Spracherkennungstechnologie (Wortfehlerrate < 8%) wird verwendet und unterstützt:
- Anzeige in Echtzeit zum Text
- 12 Dialekt-Erkennung
- Analyse des emotionalen Tons (Sprechgeschwindigkeit/Tonhöhe beeinflusst die Emotion der Reaktion der Figur)
Tests haben gezeigt, dass die Dialogfähigkeit im Sprachmodus 37% höher ist als im Textmodus, der sich besonders für Sprachschüler eignet, um den mündlichen Ausdruck zu üben.
Diese Antwort stammt aus dem ArtikelDippy: ein interaktives Tool zum Chatten mit KI-FigurenDie































