实现多模态生成需通过以下两种方式之一:
1. OpenAI兼容接口::
あるchat.completions.create
请求中添加files
パラメーター{
"model": "gemini-2.5-pro",
"messages": [{"role": "user", "content": "描述图片内容"}],
"files": ["image.jpg"]
}
2. 原生Gemini API::
あるgenerateContent
端点构造多part请求:"parts": [
{"text": "描述这张图片"},
{"file_data": {"mime_type": "image/jpeg", "file_uri": "image.jpg"}}
]
技術的な詳細
• 支持JPEG/PNG等常见格式
• 单次请求最多上传10MB内容
• 图像会先被编码为base64再传输
この答えは記事から得たものである。geminicli2api: Gemini CLIをOpenAI互換APIに変換するプロキシツールについて