
O Wan é um site de geração de conteúdo visual alimentado por IA com um modelo de código aberto chamado Wan 2.2 em seu núcleo. Essa ferramenta permite que os usuários convertam rapidamente texto, imagens ou áudio em vídeos de alta qualidade. O site oferece suporte a vários métodos de geração, incluindo “texto para vídeo”, “imagem para vídeo” e uma função exclusiva de “voz para vídeo”, que pode ser...

O VisionStory é uma plataforma completa de criação de vídeos com IA, que converte principalmente imagens estáticas e scripts de texto em vídeos falados “humanos digitais” vívidos e realistas. Os usuários só precisam fazer upload de uma foto, e o sistema pode conduzir o personagem da foto por meio da tecnologia de IA, de modo que ele tenha expressões faciais ricas e movimentos corporais naturais e, de acordo com o texto fornecido pelo usuário...

A HeyGen é uma plataforma de geração de vídeo com IA que facilita aos usuários a criação de conteúdo de vídeo de alta qualidade. No centro da plataforma está o uso da tecnologia de IA generativa para converter texto diretamente em vídeo narrado por um Avatar de IA. Os usuários não precisam de câmeras, atores ou softwares de edição complexos, apenas um roteiro,...

A Mixio é uma plataforma de transmissão ao vivo criada com tecnologia de inteligência artificial. Ela permite que os usuários transmitam ao vivo 24 horas por dia, 7 dias por semana, por meio de âncoras virtuais gerados por IA, sem a necessidade de uma pessoa real aparecer. Com uma configuração simples, os usuários podem fazer com que a IA gere automaticamente conteúdo ao vivo, interaja com os espectadores e até mesmo continue a operar quando os usuários estiverem off-line.

Xunfei Zhizuo é uma plataforma desenvolvida pela Xunfei para fornecer serviços de criação de conteúdo de inteligência artificial. Sua principal função é converter o texto inserido pelo usuário em fala, um processo geralmente chamado de “dublagem de IA” ou “síntese de fala”. Os usuários podem escolher entre uma variedade de vozes virtuais pré-programadas (ou seja, “âncoras”) com estilos diferentes, como noticiários...

MultiTalk 是一个开源的音频驱动多人对话视频生成工具,由 MeiGen-AI 开发。它通过输入多路音频、参考图像和文本提示,生成具有唇部同步的多人交互视频。项目支持真实人物和卡通角色的视频生成,适用于对话、演唱和交互控制等场景。Mu...

O FantasyTalking é um projeto de código aberto desenvolvido pela equipe do Fantasy-AMAP, com foco na geração de vídeos de retratos falados realistas por meio da geração orientada por áudio. O projeto se baseia no modelo avançado de difusão de vídeo Wan2.1, combinado com o codificador de áudio Wav2Vec e pesos de modelos proprietários, usando técnicas de inteligência artificial para obter alta ...

ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术,从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型,能生成头部动作、手势和表情,适用于展示虚拟形象或数字人动画。Ch...

VirtualWife 是一个开源的虚拟数字人项目,由开发者 yakami129 创建。它目前处于孵化阶段,目标是打造一个有“灵魂”的虚拟角色,用户可以像朋友一样与之互动。项目支持 B站直播,能通过中文语音和文字与用户交流。它结合 Open...

A Tavus é uma plataforma para desenvolvedores focada em interações entre humanos e IA, fornecendo APIs fáceis de usar que permitem aos desenvolvedores criar agentes de IA com inteligência visual, de fala e emocional. Seu principal produto, a Interface de Vídeo Conversacional (CVI), imita o cérebro humano...

HeyGem 是一款专为 Windows 系统设计的完全离线视频合成工具,由 GuijiAI(硅基智能) 团队开发并在 GitHub 上开源。它利用先进的 AI 算法精准克隆用户的外貌和声音,生成逼真的虚拟形象,并支持通过文字或语音驱动这些...

AI Studios 是由 DeepBrain AI 公司开发的一款在线 AI 视频生成平台,旨在帮助用户通过简单输入文本快速创建高质量视频内容。无需复杂软件或专业技能,用户可以利用其 AI 技术将文本、文档或网页链接转化为带有虚拟头像和语...

LiteAvatar 是由 HumanAIGC 团队(阿里旗下)开发的一款开源工具,专注于通过音频实时驱动2D虚拟形象生成面部动画。它仅依靠CPU就能以30帧每秒(fps)的速度运行,特别适合需要低功耗的场景,比如实时2D视频聊天或移动设备...

元真数字人是一家领先的AIGC(人工智能生成内容)平台,致力于为用户提供数字人直播、短视频制作、AI助手等一站式服务。平台整合了AI算法合成和GPT式大模型,支持用户创建专属问答模型,提供实时语音驱动、中文转英文实时翻译等功能。元真数字人不...

数字人生成系统是一个提供免费数字人生成服务的网站。该网站支持声音克隆、声音复刻、数字人形象模板、数字分身克隆、视频去水印等功能,旨在为用户提供高效、便捷的数字人生成解决方案。用户可以通过上传音频文件来生成数字人,并且该系统能够一比一复刻真人...

O SadTalker-Video-Lip-Sync é uma ferramenta de síntese labial de vídeo baseada na implementação do SadTalkers. O projeto gera formas labiais por meio da geração orientada por voz e usa o aprimoramento configurável da região facial para melhorar a clareza das formas labiais geradas. O projeto também usa o algoritmo de interpolação de quadros DAIN para complementar o vídeo gerado com ...

O Linly-Talker é um sistema inovador de diálogo humano digital que combina modelos de linguagem ampla (LLMs) com modelos visuais para criar uma nova abordagem para a interação humano-computador. O sistema integra várias tecnologias, como Whisper, Linly, Microsoft Speech Services e Sad...

Humva 是一个创新的AI视频生成工具,旨在通过提供用户友好的解决方案来创建专业或定制的数字化身视频。该平台利用生成式AI和先进的唇同步技术,为社交媒体内容、产品介绍、客户推荐等提供免费定制的视频发言人。用户可以通过上传一张照片来创建独特...

O Rapport Cloud é uma plataforma baseada em nuvem voltada para a criação e a implementação de personagens digitais interativos alimentados por inteligência artificial. Desenvolvida pela equipe da Speech Graphics, a plataforma utiliza sua premiada tecnologia de animação facial baseada em áudio, amplamente utilizada no setor de publicação de jogos AAA.
voltar ao topo

