Wan是一个AI驱动的视觉内容生成网站,其核心是名为Wan 2.2的开源模型。用户可以通过这个工具,将文字、图片或音频快速转换成高质量的视频。网站支持多种生成方式,包括“文字生成视频”、“图片生成视频”以及独特的“...
VisionStory ist eine All-in-One-Plattform für die Erstellung von KI-Videos, die hauptsächlich statische Bilder und Textskripte in lebendige und realistische "digitale menschliche" Sprechvideos umwandelt. Benutzer müssen nur ein Foto hochladen, und das System kann KI-Technologie verwenden, um die Person auf dem Foto zu fahren, um reiche Mimik und natürliche Gliedmaßen zu haben...
HeyGen ist eine KI-Videoplattform, die es den Nutzern leicht macht, hochwertige Videoinhalte zu erstellen. Das Herzstück der Plattform ist der Einsatz von generativer KI-Technologie, um Text direkt in Videos zu konvertieren, die von "digitalen Menschen" (KI-Avatar) gesprochen werden. Die Nutzer brauchen keine Kameras, Schauspieler oder komplexe Bearbeitungssoftware...
Mixio ist eine Live-Streaming-Plattform, die auf der Technologie der künstlichen Intelligenz basiert. Sie ermöglicht es den Nutzern, rund um die Uhr live durch KI-generierte virtuelle Moderatoren zu senden, ohne dass eine reale Person auftreten muss. Mit einer einfachen Einrichtung können Benutzer die KI automatisch Live-Inhalte generieren lassen, mit den Zuschauern interagieren und sogar weiterarbeiten, wenn die Benutzer offline sind.Mixio ist für...
Xunfei Zhizuo ist eine von Xunfei entwickelte Plattform, die Dienste zur Erstellung von Inhalten mit künstlicher Intelligenz anbietet. Ihre Kernfunktion besteht darin, vom Benutzer eingegebenen Text in Sprache umzuwandeln, ein Prozess, der oft als "KI-Synchronisation" oder "Sprachsynthese" bezeichnet wird. Die Benutzer können aus einer Reihe von voreingestellten virtuellen Stimmen (d. h. "Ankern") wählen...
MultiTalk ist ein von MeiGen-AI entwickeltes Open-Source-Tool zur Erzeugung von Mehrspieler-Dialogvideos. Es generiert interaktive Multiplayer-Videos mit Lippensynchronität durch die Eingabe von mehreren Audio-, Referenzbildern und Textaufforderungen. Das Projekt unterstützt die Videogenerierung von realen und Cartoon-Charakteren für Dialoge, Gesang...
FantasyTalking ist ein Open-Source-Projekt, das vom Fantasy-AMAP-Team entwickelt wurde und sich auf die Erzeugung realistischer sprechender Porträtvideos durch audiogesteuerte Generierung konzentriert. Das Projekt basiert auf dem fortschrittlichen Video-Diffusionsmodell Wan2.1 , kombiniert mit dem Audio-Encoder Wav2Vec und proprietären Modellgewichten, unter Verwendung von Techniken der künstlichen Intelligenz, um eine hohe ...
ChatAnyone ist ein innovatives Projekt, das von dem HumanAIGC-Team entwickelt wurde. Es nutzt Techniken der künstlichen Intelligenz, um digitale menschliche Porträtvideos mit Oberkörperbewegungen aus einem einzigen Foto und einer Audioeingabe zu erzeugen. Das Projekt basiert auf einem hierarchischen Bewegungsdiffusionsmodell, das Kopfbewegungen, Gesten und Ausdrücke generiert, die für die Präsentation virtueller...
VirtualWife ist ein Open-Source-Projekt für virtuelle digitale Personen, das vom Entwickler yakami129 entwickelt wurde. Es befindet sich derzeit in der Inkubationsphase und zielt darauf ab, einen virtuellen Charakter mit einer "Seele" zu schaffen, mit dem die Nutzer wie mit einem Freund interagieren können. Das Projekt unterstützt B-Station-Live-Streaming und kann mit Nutzern über chinesische Sprache und Text kommunizieren....
Tavus ist eine Entwicklerplattform, die sich auf die Interaktion zwischen Mensch und KI konzentriert und benutzerfreundliche APIs bereitstellt, mit denen Entwickler KI-Agenten mit visueller, sprachlicher und emotionaler Intelligenz erstellen können. Das Kernprodukt, Conversational Video Interface (CVI), ahmt das menschliche Gehirn nach...
HeyGem ist ein vollständig offline arbeitendes Video-Compositing-Tool für Windows, das vom GuijiAI (Silicon Intelligence) Team entwickelt und auf GitHub veröffentlicht wurde. Es verwendet fortschrittliche KI-Algorithmen, um das Aussehen und die Stimme des Benutzers genau zu klonen, um realistische Avatare zu erzeugen, und unterstützt...
AI Studios ist eine von DeepBrain AI entwickelte Online-Plattform zur Erzeugung von KI-Videos, die Nutzern helfen soll, durch einfache Texteingabe schnell hochwertige Videoinhalte zu erstellen. Ohne komplexe Software oder spezielle Kenntnisse zu benötigen, können Nutzer die KI-Technologie nutzen, um Text, Dokumente oder Weblinks in Videos mit virtuellen...
LiteAvatar ist ein Open-Source-Tool, das vom HumanAIGC-Team (Teil von Ali) entwickelt wurde und sich auf die Erzeugung von Gesichtsanimationen aus audiogesteuerten 2D-Avataren in Echtzeit konzentriert. Es läuft mit 30 Bildern pro Sekunde (fps) und verlässt sich nur auf die CPU. Es eignet sich besonders für Szenarien, die einen geringen Stromverbrauch erfordern, wie z. B. 2D-Videochats in Echtzeit...
Yuanzhen Digital People ist eine führende AIGC-Plattform (Artificial Intelligence Generated Content), die ihren Nutzern Dienstleistungen aus einer Hand bietet, wie z. B. Live-Übertragungen von digitalen Menschen, Kurzvideoproduktion und KI-Assistenten. Die Plattform integriert KI-Algorithmus-Synthese und große Modelle im GPT-Stil, unterstützt Nutzer bei der Erstellung exklusiver Q&A-Modelle und bietet sprachgesteuerte, chinesischsprachige Echtzeit...
Digital Man Generation System ist eine Website, die einen kostenlosen Service zur Erzeugung digitaler Personen anbietet. Die Website unterstützt das Klonen von Tönen, die Reproduktion von Tönen, das Klonen von digitalen Personenbildern, das Klonen von digitalen Splits, das Entfernen von Wasserzeichen in Videos und andere Funktionen, um den Nutzern effiziente und bequeme Lösungen für die Erzeugung digitaler Personen zu bieten. Benutzer können Audio-Text hochladen...
SadTalker-Video-Lip-Sync ist ein Video-Lippen-Synthese-Tool, das auf der SadTalker-Implementierung basiert. Das Projekt generiert Lippenformen durch stimmgesteuerte Generierung und verwendet konfigurierbare Gesichtsregionsverbesserung, um die Klarheit der generierten Lippenformen zu verbessern. Das Projekt verwendet auch den DAIN-Frame-Interpolationsalgorithmus, um das generierte Video mit ...
Linly-Talker ist ein innovatives digitales Dialogsystem, das Large Language Models (LLMs) mit visuellen Modellen kombiniert, um einen neuen Ansatz für die Interaktion zwischen Mensch und Computer zu schaffen. Das System integriert mehrere Technologien wie Whisper, Linly, Microsoft Speech Services und Sad...
Humva ist ein innovatives Tool zur Erzeugung von KI-Videos, das als benutzerfreundliche Lösung für die Erstellung professioneller oder individueller digitaler Avatar-Videos entwickelt wurde. Die Plattform nutzt generative KI und fortschrittliche Lippensynchronisationstechnologie, um kostenlos maßgeschneiderte Videosprecher für Social-Media-Inhalte, Produkteinführungen, Kundenreferenzen und mehr zu erstellen....
Rapport Cloud ist eine Cloud-basierte Plattform, die sich auf die Erstellung und Bereitstellung interaktiver digitaler Charaktere konzentriert, die durch künstliche Intelligenz unterstützt werden. Die Plattform wurde vom Team von Speech Graphics entwickelt und nutzt die preisgekrönte audio-gesteuerte Gesichtsanimationstechnologie, die in der AAA-Spieleindustrie weit verbreitet ist.
zurück zum Anfang