Derzeitige Position:Abb. Anfang " AI-Antworten

Wie kann man mit geminicli2api multimodale (Text+Bild) Inhalte generieren?

2025-08-22

709

Die multimodale Generierung muss auf eine der beiden Arten erreicht werden:

1. OpenAI-kompatible Schnittstellen::
existierenchat.completions.createDer Antrag fügt diefilesParameter:
{ "model": "gemini-2.5-pro", "messages": [{"role": "user", "content": "描述图片内容"}], "files": ["image.jpg"] }

2. natives Gemini-API::
existierengenerateContentEndpunkte konstruieren mehrteilige Anfragen:
"parts": [ {"text": "描述这张图片"}, {"file_data": {"mime_type": "image/jpeg", "file_uri": "image.jpg"}} ]

Technische Einzelheiten:
- Unterstützung von JPEG/PNG und anderen gängigen Formaten
- Hochladen von bis zu 10 MB an Inhalten in einer einzigen Anfrage
- Das Bild wird vor der Übertragung als base64 kodiert

Diese Antwort stammt aus dem Artikelgeminicli2api: Proxy-Tool zur Umwandlung von Gemini CLI in OpenAI-kompatible APIsDie

Darf nicht ohne Genehmigung vervielfältigt werden:KI-Produktivitätswerkzeuge " Wie kann man mit geminicli2api multimodale (Text+Bild) Inhalte generieren?