Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Werkzeugbibliothek

Linly-Talker: Intelligentes Dialogsystem für digitale Menschen, das große Sprachmodelle und visuelle Modelle für neue interaktive Erlebnisse kombiniert

2025-02-06 748

Linly-Talker ist ein innovatives digitales Dialogsystem, das Large Language Models (LLMs) mit visuellen Modellen kombiniert, um einen neuen Ansatz für die Interaktion zwischen Mensch und Computer zu schaffen. Das System integriert mehrere Technologien wie Whisper, Linly, Microsoft Speech Services und SadTalker Linly-Talker unterstützt Benutzer beim Hochladen von Bildern für Dialoge und verbessert die Interaktivität und den Realismus durch ein Mehrrunden-Dialogsystem. Das Projekt wurde von Kedreamix entwickelt und steht Entwicklern und Forschern auf GitHub zur Nutzung und Verbesserung zur Verfügung.

Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验-1

 

Funktionsliste

  • Mehrrunden-DialogsystemUnterstützt kontextabhängige Dialoge mit mehreren Runden für mehr Interaktivität und Realismus.
  • Dialog zum Hochladen von BildernNutzer können Bilder hochladen und mit digitalen Menschen in einen Dialog treten.
  • Sprachsynthese und -erkennungIntegriert mit Microsoft TTS und FunASR, um mehrere Sprachtypen und eine schnelle Spracherkennung zu ermöglichen.
  • Erzeugung von VideountertitelnUnterstützt die Erzeugung von Videountertiteln für verbesserte visuelle Effekte.
  • SprachklonenMit dem Modell GPT-SoVITS können Stimmen mit einer Minute Sprachdaten geklont werden.
  • Personalisierte CharaktererstellungUnterstützung der personalisierten Rollenerstellung mit mehreren Modellen und Optionen.
  • Echtzeit-DialogIntegration mit MuseTalk für grundlegende Echtzeit-Dialogfunktionen.

 

Hilfe verwenden

Einbauverfahren

  1. Klonprojekt: Führen Sie den folgenden Befehl im Terminal aus, um das Projekt zu klonen:
   git clone https://github.com/Kedreamix/Linly-Talker.git
  1. Installation von Abhängigkeiten: Wechseln Sie in das Projektverzeichnis und installieren Sie die erforderlichen Abhängigkeiten:
   cd Linly-Talker
pip install -r requirements_app.txt
pip install -r requirements_webui.txt
  1. Konfiguration der UmgebungKonfigurieren Sie die Umgebungsvariablen und Zertifikate nach Bedarf, um den ordnungsgemäßen Betrieb des Systems sicherzustellen.

Leitlinien für die Verwendung

  1. Starten der WebUIFühren Sie den folgenden Befehl aus, um die WebUI zu starten:
   python webui.py

Öffnen Sie Ihren Browser, um auf http://localhost:7860Wenn Sie auf die Weboberfläche von Linly-Talker zugreifen möchten, können Sie dies tun, indem Sie auf den folgenden Link klicken.

  1. Bilder für den Dialog hochladen::
    • Klicken Sie in der WebUI-Oberfläche auf die Schaltfläche "Bild hochladen" und wählen Sie die hochzuladende Bilddatei aus.
    • Sobald das Bild hochgeladen ist, generiert das System automatisch Dialoginhalte und der Benutzer kann mit der digitalen Person interagieren.
  2. Sprachsynthese und -erkennung::
    • Geben Sie den Text in das Dialogfeld ein, wählen Sie den Sprachtyp aus, klicken Sie auf die Schaltfläche "Stimme erzeugen", das System synthetisiert die Stimme und spielt sie ab.
    • Die Benutzer können auch ihre Stimme über das Mikrofon eingeben, und das System erkennt und generiert automatisch Text.
  3. Erzeugung von Videountertiteln::
    • Laden Sie eine Videodatei hoch, das System generiert automatisch Untertitel und bettet sie in das Video ein, und die Benutzer können die Videodatei mit Untertiteln herunterladen.
  4. Sprachklonen::
    • Laden Sie eine Stimmprobe der Zielperson hoch, und das System verwendet das GPT-SoVITS-Modell zum Klonen der Stimme, um eine der Zielperson ähnliche Stimme zu erzeugen.
  5. Personalisierte Charaktererstellung::
    • Wählen Sie in der WebUI-Oberfläche die Option "Personalisierte Persona-Generierung", geben Sie die Persona-Informationen ein, und das System wird eine personalisierte Persona generieren.
  6. Echtzeit-Dialog::
    • Wenn Sie das MuseTalk-Modul auswählen, schaltet das System die Echtzeit-Dialogfunktion ein, die es dem Benutzer ermöglicht, mit der digitalen Person in Echtzeit zu interagieren.

 

Windows-Komplett-Installationsprogramm

AI生产力应用Dieser Inhalt wurde vom Autor versteckt, bitte geben Sie den Verifizierungscode ein, um den Inhalt zu sehen
Captcha:
Bitte achten Sie auf diese Website WeChat öffentliche Nummer, Antwort "CAPTCHA, eine Art von Challenge-Response-Test (Computertechnik)", um den Verifizierungscode zu erhalten. Suchen Sie in WeChat nach "AI-Produktivitätsanwendungen"oder"Künstlich9527" oder WeChat Scannen der rechten Seite des QR-Codes kann die Aufmerksamkeit auf diese Website WeChat öffentliche Zahl zu zahlen.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

Posteingang

Kontakt

zurück zum Anfang

de_DEDeutsch