オールメディアの物語番組における技術的ブレークスルー
Gemini Storybookは、コンテンツの質を保証するためにAIが生成した文学的な物語、視覚的なプレゼンテーションを強化するために様式化されたイラスト、そしてリスニング体験を完成させるためのインテリジェントな音声読み上げという3つのコンテンツの統合を通じて、デジタル絵本を再定義する。このマルチメディアの統合は、単純な機能の積み重ねとは異なり、統一されたクリエーション・エンジンによる芸術的スタイルの調和である。
ビジュアル面では、クレイアニメーションや水彩画など8種類以上のアートスタイルが用意されており、それぞれがキャラクターデザイン、シーンレンダリング、レイアウト構成に同時に影響を与える。音声面では、ナレーターがストーリーの雰囲気を正確に伝えられるよう、イントネーションと発話速度の継続的な調整をサポートするWaveNetニューラルネットワーク音声を使用しています。このエンド・ツー・エンドのメディア制作能力により、プロフェッショナルでないユーザーでも出版水準のマルチメディア作品を制作することができる。
この答えは記事から得たものである。ジェミニ・ストーリーブック:パーソナライズされたオーディオ絵本の作成について




























