Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

Wie kann man mit geminicli2api multimodale (Text+Bild) Inhalte generieren?

2025-08-22 709
Link direktMobile Ansicht
qrcode

Die multimodale Generierung muss auf eine der beiden Arten erreicht werden:

1. OpenAI-kompatible Schnittstellen::
existierenchat.completions.createDer Antrag fügt diefilesParameter:
{
"model": "gemini-2.5-pro",
"messages": [{"role": "user", "content": "描述图片内容"}],
"files": ["image.jpg"]
}

2. natives Gemini-API::
existierengenerateContentEndpunkte konstruieren mehrteilige Anfragen:
"parts": [
{"text": "描述这张图片"},
{"file_data": {"mime_type": "image/jpeg", "file_uri": "image.jpg"}}
]

Technische Einzelheiten:
- Unterstützung von JPEG/PNG und anderen gängigen Formaten
- Hochladen von bis zu 10 MB an Inhalten in einer einzigen Anfrage
- Das Bild wird vor der Übertragung als base64 kodiert

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang