Wanは、Wan 2.2と呼ばれるオープンソースモデルを中核とする、AIを活用した映像コンテンツ生成サイトである。このツールにより、ユーザーはテキスト、画像、音声を高品質な動画に素早く変換することができる。このサイトでは、「テキストを動画に」、「画像を動画に」、そしてユニークな「...」など、さまざまな生成方法をサポートしている。
VisionStory 是一个一体化的AI视频创作平台,主要功能是将静态图片和文本脚本转化为生动逼真的“数字人”说话视频。用户只需上传一张照片,系统即可通过AI技术驱动照片中的人物,使其拥有丰富的面部表情和自然的肢...
HeyGenは、ユーザーが簡単に高品質のビデオコンテンツを作成できるAIビデオ生成プラットフォームである。このプラットフォームの核となるのは、テキストを直接「デジタル・ピープル」(AIアバター)がナレーションする動画に変換するジェネレーティブAI技術だ。ユーザーはカメラや俳優、複雑な編集ソフトを必要としない。
ミクシオは、人工知能技術を使って作られたライブ・ストリーミング・プラットフォームである。生身の人間を登場させることなく、AIが生成したバーチャル・キャスターを通じて24時間365日生放送を行うことができる。簡単なセットアップで、AIが自動的にライブコンテンツを生成し、視聴者と対話し、さらにユーザーがオフラインのときでも操作を続けることができる。
Xunfei Zhizuoは、人工知能コンテンツ作成サービスを提供するためにXunfeiによって開発されたプラットフォームです。その中核機能は、ユーザーが入力したテキストを音声に変換することであり、このプロセスはしばしば「AIダビング」または「音声合成」と呼ばれる。ユーザーはプリセットされた様々なバーチャルボイス(すなわち「アンカー」)から選択することができる...
MultiTalkは、MeiGen-AIによって開発されたオープンソースの音声駆動型マルチプレイヤー対話ビデオ生成ツールです。複数の音声、参照画像、テキストプロンプトを入力することで、リップシンク付きのマルチプレイヤーインタラクティブビデオを生成します。このプロジェクトは、対話、歌、...のためのリアルおよびカートゥーンキャラクタのビデオ生成をサポートしています。
FantasyTalkingは、Fantasy-AMAPチームによって開発されたオープンソースプロジェクトです。このプロジェクトは、先進的なビデオ拡散モデルWan2.1に基づいており、オーディオエンコーダWav2Vecと独自のモデルの重みを組み合わせて、人工知能の技術を使用して、高い精度を実現しています。
ChatAnyoneはHumanAIGCチームによって開発された革新的なプロジェクトである。人工知能技術を用いて、1枚の写真と音声入力から、上半身の動きを伴うデジタル人物のポートレート動画を生成する。このプロジェクトは階層的な運動拡散モデルに基づいており、バーチャルな...
VirtualWifeは、開発者yakami129によって作られたオープンソースのバーチャルデジタルパーソンプロジェクトである。現在インキュベーション段階にあり、ユーザーが友人のように交流できる「魂」を持ったバーチャル・キャラクターを作ることを目指している。このプロジェクトはBステーションのライブストリーミングをサポートし、中国語の音声とテキストでユーザーとコミュニケーションすることができる。
Tavusは人間とAIのインタラクションに特化した開発者向けプラットフォームで、開発者が視覚、音声、感情知能を備えたAIエージェントを構築できる使いやすいAPIを提供している。その中核製品であるConversational Video Interface(CVI)は、人間の脳を模倣している。
HeyGemはWindowsシステム用に設計された完全オフラインのビデオ合成ツールで、GuijiAI (Silicon Intelligence)チームによって開発され、GitHubでオープンソース化されています。高度なAIアルゴリズムを使用して、ユーザーの外見と声を正確に複製し、リアルなアバターを生成します。
AI Studiosは、DeepBrain AIが開発したオンラインAI動画生成プラットフォームで、ユーザーがテキストを入力するだけで、高品質の動画コンテンツを素早く作成できるように設計されている。複雑なソフトウェアや専門的なスキルを必要とせず、ユーザーはAI技術を使ってテキストや文書、ウェブリンクをバーチャルな動画に変換することができる。
LiteAvatarは、HumanAIGCチーム(Aliの一部)によって開発されたオープンソースツールで、音声駆動型の2Dアバターからリアルタイムでフェイシャルアニメーションを生成することに重点を置いています。CPUのみに依存し、毎秒30フレーム(fps)で動作し、リアルタイムの2Dビデオチャットのような低消費電力を必要とするシナリオに特に適しています...
遠鎮デジタルピープルは、デジタルピープルのライブ放送、ショートビデオ制作、AIアシスタントなどのワンストップサービスをユーザーに提供することに特化したAIGC(人工知能生成コンテンツ)プラットフォームのリーディングカンパニーである。このプラットフォームは、AIアルゴリズム合成とGPTスタイルのビッグモデルを統合し、ユーザーが独占的なQ&Aモデルを作成することをサポートし、リアルタイムで音声主導の中...
デジタル人物生成システムは無料でデジタル人物生成サービスを提供するウェブサイトです。本サイトは、音声クローン、音声再生、デジタル人物画像テンプレート、デジタル分割クローン、動画透かし除去などの機能をサポートし、ユーザーに効率的で便利なデジタル人物生成ソリューションを提供することを目指しています。ユーザーは音声テキストをアップロードすることができます...
SadTalker-Video-Lip-Syncは、SadTalkersの実装に基づいたビデオリップ合成ツールです。このプロジェクトは、音声駆動型の生成によって唇の形を生成し、設定可能な顔領域の強調を使用して、生成された唇の形の鮮明度を向上させます。また、DAINフレーム補間アルゴリズムを使用して、生成されたビデオに...
Linly-Talkerは、大規模言語モデル(LLM)と視覚モデルを組み合わせた革新的なデジタル人間対話システムであり、人間とコンピュータの対話への斬新なアプローチを生み出している。このシステムは、Whisper、Linly、Microsoft Speech Services、Sad...といった様々な技術を統合している。
Humvaは革新的なAIビデオ生成ツールで、ユーザーフレンドリーなソリューションを提供することで、プロフェッショナルまたはカスタマイズされたデジタルアバタービデオを作成するように設計されています。このプラットフォームは、生成的AIと高度なリップシンク技術を活用し、ソーシャルメディアコンテンツ、製品紹介、顧客の声などのために、カスタマイズされたビデオスポークスマンを無料で提供します。
Rapport Cloudは、人工知能を搭載したインタラクティブなデジタルキャラクターの作成と展開に特化したクラウドベースのプラットフォームです。Speech Graphicsのチームによって開発されたこのプラットフォームは、AAAゲームパブリッシング業界で広く使用されている、受賞歴のある音声駆動型フェイシャルアニメーション技術を利用しています。
トップに戻る