テキストと画像のマルチモーダルなコンテンツ生成を実現するには？

2025-08-22

647

マルチモーダル支援プログラム

geminicli2apiは、テキスト入力と画像入力の同時処理をサポートし、コンテンツ作成、教育などのためのソリューションを提供します：

APIコール・メソッド::
- OpenAI互換インターフェースfiles画像パスを入力します。
- ジェミニネイティブインターフェースparts配列にはfileDataボーイフレンド
ファイルフォーマットJPEG/PNG/GIFおよびその他の一般的なフォーマットをサポートし、単一ファイルは4MB未満を推奨。
ミキシング・インストラクション例：「この写真に写っている主なものを説明してください」）。