Multimodales Förderprogramm
geminicli2api unterstützt die gleichzeitige Verarbeitung von Text- und Bildeingaben und bietet damit Lösungen für die Erstellung von Inhalten, den Unterricht und vieles mehr:
Schritte zur Umsetzung
- API-Aufruf-Methoden::
- OpenAI-kompatible Schnittstelle: über
filesFeld gibt den Bildpfad an (unterstützt lokale Dateien/URLs) - Native Gemini-Schnittstelle: in
partsDas Array enthältfileDataFreund
- OpenAI-kompatible Schnittstelle: über
- DateiformatUnterstützt JPEG/PNG/GIF und andere gängige Formate. Es wird empfohlen, dass eine einzelne Datei weniger als 4 MB groß ist.
- MischanweisungDie Nachricht sollte sowohl Textanweisungen als auch Bildreferenzen enthalten (z. B. "Beschreiben Sie das Hauptobjekt auf diesem Bild").
Anwendungsfälle
- Bildung: Fotos von Matheaufgaben für schrittweise Antworten hochladen
- E-Commerce-Szenario: Analyse von Produktbildern zur Erstellung von Marketingtexten
- Medizinische Assistenz: Interpretation von abnormen Merkmalen in der medizinischen Bildgebung
Diese Antwort stammt aus dem Artikelgeminicli2api: Proxy-Tool zur Umwandlung von Gemini CLI in OpenAI-kompatible APIsDie































