Bei der Verwendung dieses Werkzeugs ist besondere Vorsicht geboten:
- Sicherheit der Authentifizierung::
GEMINI_AUTH_PASSWORD
Muss auf einen Wert ungleich Null gesetzt werden, sonst geben alle API-Anfragen einen 401-Fehler zurück - Quotenüberwachung::
Das kostenlose Google Cloud-Tier hat ein Limit von 60 Anrufen pro Minute, und es wird empfohlen, diegcloud quota metrics
Nutzung überwachen - Streaming-Reaktion::
Clients müssen eine Logik für den Empfang von Chunked-Daten implementieren, da gewöhnliche HTTP-Bibliotheken möglicherweise nicht in der Lage sind, Antworten im SSE-Format direkt zu verarbeiten. - OAuth-Zeitlimit::
Die Standardgültigkeit von refresh_token beträgt 7 Tage, bei lang laufenden Diensten muss ein Mechanismus zur automatischen Erneuerung implementiert werden.
Empfohlene Praktiken für Produktionsumgebungen:
- Verwaltung des Service-Lebenszyklus mit Docker Compose
- Hinzufügen von HTTPS und Ratenbegrenzung über Nginx
- Regelmäßige Rotation der API-Zugangspasswörter
Diese Antwort stammt aus dem Artikelgeminicli2api: Proxy-Tool zur Umwandlung von Gemini CLI in OpenAI-kompatible APIsDie