
Wan ist eine KI-gestützte Website zur Erstellung visueller Inhalte, deren Kernstück ein Open-Source-Modell namens Wan 2.2 ist. Mit diesem Tool können Nutzerinnen und Nutzer schnell Text, Bilder oder Audio in hochwertige Videos umwandeln. Die Website unterstützt eine Vielzahl von Generierungsmethoden, darunter “Text zu Video”, “Bild zu Video” und eine einzigartige “Stimme zu Video”-Funktion, die in...

VisionStory ist eine All-in-One-Plattform zur Erstellung von KI-Videos, die statische Bilder und Textskripte in lebendige und lebensechte Sprechvideos von “digitalen Menschen” verwandelt. Benutzer müssen nur ein Foto hochladen, und das System kann die Figur auf dem Foto durch KI-Technologie steuern, so dass sie reiche Gesichtsausdrücke und natürliche Körperbewegungen hat, und entsprechend dem vom Benutzer bereitgestellten Text...

HeyGen ist eine Plattform zur Erzeugung von KI-Videos, die es den Nutzern leicht macht, hochwertige Videoinhalte zu erstellen. Das Herzstück der Plattform ist die Verwendung von generativer KI-Technologie, um Text direkt in ein Video zu konvertieren, das von einem KI-Avatar gesprochen wird. Die Nutzer brauchen keine Kameras, Schauspieler oder komplexe Bearbeitungssoftware, sondern nur ein Skript,...

Mixio ist eine Live-Streaming-Plattform, die auf der Technologie der künstlichen Intelligenz basiert. Sie ermöglicht es den Nutzern, rund um die Uhr mit Hilfe von KI-generierten virtuellen Moderatoren live zu senden, ohne dass eine reale Person auftreten muss. Mit einer einfachen Einrichtung können Nutzer die KI automatisch Live-Inhalte generieren lassen, mit den Zuschauern interagieren und sogar weiterarbeiten, wenn die Nutzer offline sind.Mixio eignet sich für Content-Ersteller, Markenhändler oder diejenigen, die schnell...

Xunfei Zhizuo ist eine von Xunfei entwickelte Plattform, die Dienste zur Erstellung von Inhalten mit künstlicher Intelligenz anbietet. Ihre Kernfunktion besteht darin, vom Benutzer eingegebenen Text in Sprache umzuwandeln, ein Prozess, der oft als “KI-Synchronisation” oder “Sprachsynthese” bezeichnet wird. Die Benutzer können aus einer Vielzahl vorprogrammierter virtueller Stimmen (d. h. “Moderatoren”) mit verschiedenen Stilen wählen, wie z. B. Nachrichtensendungen...

MultiTalk 是一个开源的音频驱动多人对话视频生成工具,由 MeiGen-AI 开发。它通过输入多路音频、参考图像和文本提示,生成具有唇部同步的多人交互视频。项目支持真实人物和卡通角色的视频生成,适用于对话、演唱和交互控制等场景。Mu...

FantasyTalking ist ein Open-Source-Projekt, das vom Fantasy-AMAP-Team entwickelt wurde und sich auf die Erzeugung realistischer sprechender Porträtvideos durch audiogesteuerte Generierung konzentriert. Das Projekt basiert auf dem fortschrittlichen Video-Diffusionsmodell Wan2.1 , kombiniert mit dem Audio-Encoder Wav2Vec und proprietären Modellgewichten, unter Verwendung von Techniken der künstlichen Intelligenz, um eine hohe ...

ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术,从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型,能生成头部动作、手势和表情,适用于展示虚拟形象或数字人动画。Ch...

VirtualWife 是一个开源的虚拟数字人项目,由开发者 yakami129 创建。它目前处于孵化阶段,目标是打造一个有“灵魂”的虚拟角色,用户可以像朋友一样与之互动。项目支持 B站直播,能通过中文语音和文字与用户交流。它结合 Open...

Tavus ist eine Entwicklerplattform, die sich auf die Interaktion zwischen Mensch und KI konzentriert und benutzerfreundliche APIs bereitstellt, mit denen Entwickler KI-Agenten mit visueller, sprachlicher und emotionaler Intelligenz erstellen können. Das Kernprodukt, Conversational Video Interface (CVI), ahmt das menschliche Gehirn nach...

HeyGem 是一款专为 Windows 系统设计的完全离线视频合成工具,由 GuijiAI(硅基智能) 团队开发并在 GitHub 上开源。它利用先进的 AI 算法精准克隆用户的外貌和声音,生成逼真的虚拟形象,并支持通过文字或语音驱动这些...

AI Studios 是由 DeepBrain AI 公司开发的一款在线 AI 视频生成平台,旨在帮助用户通过简单输入文本快速创建高质量视频内容。无需复杂软件或专业技能,用户可以利用其 AI 技术将文本、文档或网页链接转化为带有虚拟头像和语...

LiteAvatar 是由 HumanAIGC 团队(阿里旗下)开发的一款开源工具,专注于通过音频实时驱动2D虚拟形象生成面部动画。它仅依靠CPU就能以30帧每秒(fps)的速度运行,特别适合需要低功耗的场景,比如实时2D视频聊天或移动设备...

元真数字人是一家领先的AIGC(人工智能生成内容)平台,致力于为用户提供数字人直播、短视频制作、AI助手等一站式服务。平台整合了AI算法合成和GPT式大模型,支持用户创建专属问答模型,提供实时语音驱动、中文转英文实时翻译等功能。元真数字人不...

Digital Man Generation System ist eine Website, die einen kostenlosen Service zur Erzeugung digitaler Personen anbietet. Die Website unterstützt das Klonen von Stimmen, die Replikation von Stimmen, die Erstellung von Bildvorlagen für digitale Personen, das Klonen von digitalen Splits, die Entfernung von Wasserzeichen in Videos und andere Funktionen, um den Nutzern effiziente und bequeme Lösungen zur Erzeugung digitaler Personen zu bieten. Benutzer können Audiodateien hochladen, um eine digitale Person zu generieren, und das System ist in der Lage, eine Eins-zu-eins-Replikation von...

SadTalker-Video-Lip-Sync ist ein Video-Lippen-Synthese-Tool, das auf der SadTalker-Implementierung basiert. Das Projekt generiert Lippenformen durch stimmgesteuerte Generierung und verwendet konfigurierbare Gesichtsregionsverbesserung, um die Klarheit der generierten Lippenformen zu verbessern. Das Projekt verwendet auch den DAIN-Frame-Interpolationsalgorithmus, um das generierte Video mit ...

Linly-Talker ist ein innovatives digitales Dialogsystem, das Large Language Models (LLMs) mit visuellen Modellen kombiniert, um einen neuen Ansatz für die Interaktion zwischen Mensch und Computer zu schaffen. Das System integriert mehrere Technologien wie Whisper, Linly, Microsoft Speech Services und Sad...

Humva 是一个创新的AI视频生成工具,旨在通过提供用户友好的解决方案来创建专业或定制的数字化身视频。该平台利用生成式AI和先进的唇同步技术,为社交媒体内容、产品介绍、客户推荐等提供免费定制的视频发言人。用户可以通过上传一张照片来创建独特...

Rapport Cloud ist eine Cloud-basierte Plattform, die sich auf die Erstellung und Bereitstellung interaktiver digitaler Charaktere konzentriert, die durch künstliche Intelligenz unterstützt werden. Die Plattform wurde vom Team von Speech Graphics entwickelt und nutzt die preisgekrönte audio-gesteuerte Gesichtsanimationstechnologie, die in der AAA-Spieleindustrie weit verbreitet ist.
zurück zum Anfang

