geminicli2apiでマルチモーダル（テキスト＋画像）コンテンツ生成を実装するには？

2025-08-22

712

マルチモーダル世代は、2つの方法のいずれかで達成される必要がある：

1.OpenAI互換インターフェース::
あるchat.completions.createこのリクエストはfilesパラメーター
{ "model": "gemini-2.5-pro", "messages": [{"role": "user", "content": "描述图片内容"}], "files": ["image.jpg"] }

2.ネイティブジェミニAPI::
あるgenerateContentエンドポイントはマルチパートリクエストを構築する：
"parts": [ {"text": "描述这张图片"}, {"file_data": {"mime_type": "image/jpeg", "file_uri": "image.jpg"}} ]

技術的な詳細
- JPEG/PNGおよびその他の一般的なフォーマットをサポート
- 1回のリクエストで最大10MBのコンテンツをアップロード可能
- 画像は転送される前にbase64としてエンコードされる。

この答えは記事から得たものである。geminicli2api: Gemini CLIをOpenAI互換APIに変換するプロキシツールについて

geminicli2apiでマルチモーダル（テキスト＋画像）コンテンツ生成を実装するには？

おすすめ

AIツールが見つからない？こちらをお試しください！

人気のAIツール

新着情報

最新のAIツール

geminicli2apiでマルチモーダル（テキスト＋画像）コンテンツ生成を実装するには？

おすすめ

AIツールが見つからない？こちらをお試しください！

人気のAIツール

新着情報

最新のAIツール

クイック照会ステーションAIツール