マルチモーダル支援プログラム
geminicli2apiは、テキスト入力と画像入力の同時処理をサポートし、コンテンツ作成、教育などのためのソリューションを提供します:
実施手順
- APIコール・メソッド::
- OpenAI互換インターフェース
files
画像パスを入力します。 - ジェミニネイティブインターフェース
parts
配列にはfileData
ボーイフレンド
- OpenAI互換インターフェース
- ファイルフォーマットJPEG/PNG/GIFおよびその他の一般的なフォーマットをサポートし、単一ファイルは4MB未満を推奨。
- ミキシング・インストラクション例:「この写真に写っている主なものを説明してください」)。
アプリケーション事例
- 教育:数学の問題の写真をアップロードして、ステップ・バイ・ステップの解答を見ることができる。
- Eコマースのシナリオ:商品画像を分析してマーケティングコピーを作成する
- 医療補助:医療画像における異常な特徴の解釈
この答えは記事から得たものである。geminicli2api: Gemini CLIをOpenAI互換APIに変換するプロキシツールについて