Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito
Posição atual:fig. início " Respostas da IA

如何用geminicli2api实现多模态(文本+图片)内容生成?

2025-08-22 452

实现多模态生成需通过以下两种方式之一:

1. OpenAI兼容接口::
existirchat.completions.create请求中添加filesParâmetros:
{
"model": "gemini-2.5-pro",
"messages": [{"role": "user", "content": "描述图片内容"}],
"files": ["image.jpg"]
}

2. 原生Gemini API::
existirgenerateContent端点构造多part请求:
"parts": [
{"text": "描述这张图片"},
{"file_data": {"mime_type": "image/jpeg", "file_uri": "image.jpg"}}
]

Detalhes técnicos:
• 支持JPEG/PNG等常见格式
• 单次请求最多上传10MB内容
• 图像会先被编码为base64再传输

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

voltar ao topo

pt_BRPortuguês do Brasil