O FantasyTalking é um projeto de código aberto desenvolvido pela equipe do Fantasy-AMAP, com foco na geração de vídeos de retratos falados realistas por meio da geração orientada por áudio. O projeto se baseia no modelo avançado de difusão de vídeo Wan2.1, combinado com o codificador de áudio Wav2Vec e pesos de modelos proprietários, usando técnicas de inteligência artificial para obter alta ...
O ChatAnyone é um projeto inovador desenvolvido pela equipe do HumanAIGC. Ele usa técnicas de inteligência artificial para gerar vídeos digitais de retratos humanos com movimentos da parte superior do corpo a partir de uma única foto e entrada de áudio. O projeto se baseia em um modelo de difusão de movimento hierárquico que gera movimentos de cabeça, gestos e expressões adequados para a apresentação de...
O VirtualWife é um projeto de pessoa digital virtual de código aberto criado pelo desenvolvedor yakami129. Atualmente, ele está em fase de incubação e tem como objetivo criar um personagem virtual com uma "alma" com a qual os usuários possam interagir como um amigo. O projeto é compatível com a transmissão ao vivo do B-station e pode se comunicar com os usuários por meio de voz e texto em chinês....
A Tavus é uma plataforma para desenvolvedores focada em interações entre humanos e IA, fornecendo APIs fáceis de usar que permitem aos desenvolvedores criar agentes de IA com inteligência visual, de fala e emocional. Seu principal produto, a Interface de Vídeo Conversacional (CVI), imita o cérebro humano...
O HeyGem é uma ferramenta de composição de vídeo totalmente off-line projetada para sistemas Windows, desenvolvida pela equipe do GuijiAI (Silicon Intelligence) e de código aberto no GitHub. Ele usa algoritmos avançados de IA para clonar com precisão a aparência e a voz do usuário e gerar avatares realistas, além de oferecer suporte a texto ou voz...
O AI Studios é uma plataforma on-line de geração de vídeo com IA desenvolvida pela DeepBrain AI, projetada para ajudar os usuários a criar rapidamente conteúdo de vídeo de alta qualidade simplesmente inserindo texto. Sem a necessidade de um software complexo ou de habilidades especializadas, os usuários podem usar sua tecnologia de IA para transformar textos, documentos ou links da Web em vídeos com...
O LiteAvatar é uma ferramenta de código aberto desenvolvida pela equipe HumanAIGC (parte do Ali) que se concentra na geração de animações faciais de avatares 2D acionados por áudio em tempo real. Ele é executado a 30 quadros por segundo (fps), dependendo apenas da CPU, e é especialmente adequado para cenários que exigem baixo consumo de energia, como bate-papo por vídeo 2D em tempo real...
A Yuanzhen Digital People é uma plataforma líder de AIGC (Conteúdo Gerado por Inteligência Artificial) dedicada a fornecer aos usuários serviços completos, como transmissão ao vivo de pessoas digitais, produção de vídeos curtos e assistente de IA. A plataforma integra a síntese de algoritmos de IA e grandes modelos no estilo GPT, oferece suporte aos usuários para a criação de modelos exclusivos de perguntas e respostas e fornece serviços de voz em tempo real...
O Digital Man Generation System é um site que oferece um serviço gratuito de geração de pessoas digitais. O site suporta clonagem de som, reprodução de som, modelo de imagem de pessoa digital, clonagem de divisão digital, remoção de marca d'água de vídeo e outras funções, com o objetivo de fornecer aos usuários soluções eficientes e convenientes de geração de pessoa digital. Os usuários podem fazer upload de texto de áudio...
O SadTalker-Video-Lip-Sync é uma ferramenta de síntese labial de vídeo baseada na implementação do SadTalkers. O projeto gera formas labiais por meio da geração orientada por voz e usa o aprimoramento configurável da região facial para melhorar a clareza das formas labiais geradas. O projeto também usa o algoritmo de interpolação de quadros DAIN para complementar o vídeo gerado com ...
O Linly-Talker é um sistema inovador de diálogo humano digital que combina modelos de linguagem ampla (LLMs) com modelos visuais para criar uma nova abordagem para a interação humano-computador. O sistema integra várias tecnologias, como Whisper, Linly, Microsoft Speech Services e Sad...
O Humva é uma ferramenta inovadora de geração de vídeo com IA projetada para criar vídeos de avatares digitais profissionais ou personalizados, oferecendo uma solução fácil de usar. A plataforma utiliza IA generativa e tecnologia avançada de sincronização labial para fornecer porta-vozes de vídeo personalizados gratuitos para conteúdo de mídia social, apresentações de produtos, depoimentos de clientes e muito mais....
O Rapport Cloud é uma plataforma baseada em nuvem voltada para a criação e a implementação de personagens digitais interativos alimentados por inteligência artificial. Desenvolvida pela equipe da Speech Graphics, a plataforma utiliza sua premiada tecnologia de animação facial baseada em áudio, amplamente utilizada no setor de publicação de jogos AAA.
O Metaverse AI (versão de código aberto) é um projeto hospedado no GitHub, desenvolvido pela equipe da libn-net. Ele pode clonar imagens e vozes humanas digitais por meio da tecnologia de IA para gerar vídeos curtos e também suporta dublagem e legendagem. A ferramenta está disponível para Windows, Web, H5 e applets. .....
O Dreamface é uma poderosa ferramenta de IA projetada para ajudar os usuários a criar facilmente vídeos e imagens de alta qualidade. Com operações simples, os usuários podem gerar vídeos de avatar animados personalizados, reparar fotos antigas, remover fundos de fotos e muito mais. O site oferece uma variedade de recursos orientados por IA que tornam os vídeos e as imagens...
A Gan.AI é uma empresa dedicada a fornecer soluções de personalização de vídeo por meio de tecnologia de inteligência artificial. A plataforma permite que os usuários gerem rapidamente conteúdo de vídeo de alta qualidade sem a necessidade de uma câmera ou equipe de filmagem. Os principais produtos da Gan.AI incluem personalização de vídeo, geração e personalização de avatares, narrações e pares de...
Olá a todos, hoje estou compartilhando com vocês uma ferramenta de criação de pessoas digitais! Ela é fácil de usar e suporta processamento em lote. (Pacote de integração no final do artigo para uso próprio) Acredito que aprendemos algo sobre a tecnologia de pessoas digitais. Antes do incêndio, Guo Degang falava inglês, a beleza russa falava chinês etc., e essa é a personificação da tecnologia de pessoas digitais. Pessoas digitais...
O LiveTalking é um sistema humano digital interativo em tempo real de código aberto, dedicado à criação de soluções humanas digitais ao vivo de alta qualidade. O projeto usa o protocolo de código aberto Apache 2.0 e integra várias tecnologias de ponta, incluindo renderização ER-NeRF, processamento de fluxo de áudio e vídeo em tempo real, sincronização labial e assim por diante. O sistema é compatível com a transmissão digital humana em tempo real ...
O JoyGen é uma estrutura inovadora de geração de vídeo em dois estágios para rostos falantes, com foco na solução do problema de geração de expressões faciais orientadas por áudio. Desenvolvido por uma equipe da Jingdong Technology, o projeto usa técnicas avançadas de reconstrução em 3D e métodos de extração de recursos de áudio para capturar com precisão os recursos de identidade e os coeficientes de expressão do falante para obter...