Zusätzlich zum Basismodell (z.B. gemini-2.5-pro) bietet das Projekt spezielle Funktionen durch Suffix-Varianten:
- -Suchvariante(Beispiel: gemini-2.5-pro-search):
Aktivieren Sie die Erweiterungen der Google-Suche für Szenarien, die den Abruf von Web-Informationen in Echtzeit erfordern, wie z. B. die Erstellung von News Digest - -nicht denkende Variante::
Reduzierte Modellinferenzschritte, wobei ein Teil der Antwortqualität für eine schnellere Antwort geopfert wird, geeignet für Echtzeit-Dialogszenarien - -maxthinking-Variante::
Erhöhtes Inferenzbudget auf 32.768 Token für komplexe Probleme, die eine tiefgreifende Analyse erfordern, wie z. B. die Interpretation wissenschaftlicher Arbeiten
Die Entwickler können diese Variantennamen bei API-Aufrufen direkt angeben, und das System wird die entsprechenden Inferenzparameter automatisch anpassen. Dieses Design bewahrt die ursprünglichen Fähigkeiten von Gemini und bietet gleichzeitig Optimierungsmöglichkeiten für verschiedene Szenarien.
Diese Antwort stammt aus dem Artikelgeminicli2api: Proxy-Tool zur Umwandlung von Gemini CLI in OpenAI-kompatible APIsDie































