É necessário cuidado especial ao usar essa ferramenta:
- Segurança de autenticação::
GEMINI_AUTH_PASSWORDDeve ser definido como um valor não nulo ou todas as solicitações de API retornarão um erro 401 - monitoramento de cotas::
A camada gratuita do Google Cloud tem um limite de 60 chamadas por minuto, e é recomendável passar o limite degcloud quota metricsMonitorar o uso - resposta de streaming::
Os clientes precisam implementar a lógica de recepção de dados em pedaços; as bibliotecas HTTP comuns podem não ser capazes de lidar diretamente com a resposta no formato SSE - Limite de tempo do OAuth::
A validade padrão do refresh_token é de 7 dias; os serviços de longa duração precisam implementar um mecanismo de renovação automática
Práticas recomendadas para ambientes de produção:
- Gerenciando o ciclo de vida do serviço com o Docker Compose
- Adição de HTTPS e limitação de taxa via Nginx
- Rotação periódica das senhas de acesso à API
Essa resposta foi extraída do artigogeminicli2api: Ferramenta proxy para converter a CLI do Gemini em APIs compatíveis com OpenAIO































