Programa de gerenciamento de cotas da API
Os controles a seguir são recomendados para evitar que as restrições de cota livre da API do Gemini afetem o uso:
- Mecanismo de processamento em loteDivisão de grandes lotes de tarefas em lotes menores, de no máximo 15 artigos por vez, a serem executados em intervalos de 2 horas. Isso pode ser feito modificando o parâmetro
batch_process.pyaumentartime.sleep(7200)Ativa o espaçamento automático. - monitoramento de cotasConfigure alertas de uso no painel do Google AI Studio para pausar automaticamente a tarefa quando o uso diário atingir 80%. Podem ser escritas chamadas simples de script de monitoramento em Python
google.generativeai.get_usage()API. - Programa alternativoMudança automática para o modelo de resumo local T5-pequeno incorporado ao projeto quando a API principal for ultrapassada (precisa ser instalado com antecedência)
transformersbiblioteca), que é de qualidade um pouco inferior, mas garante a continuidade do serviço. - sistema de cacheCrie um banco de dados de cache SQLite de URLs de papéis processados para evitar o consumo de cotas ao solicitar repetidamente o mesmo conteúdo.
Em caso de emergência, você pode solicitar várias contas do Google para distribuir o uso e obter o balanceamento de carga alternando as chaves de API.
Essa resposta foi extraída do artigoArXiv Paper Summarizer: uma ferramenta para resumo automático de artigos do arXivO































