O custo da funcionalidade de IA é composto por três componentes principais:
Estrutura de custos
- custo básicoSoftware de código aberto: o próprio software de código aberto é gratuito (licença MIT)
- Taxa de invocação de APIFaturamento com base na quantidade de tokens OpenAI/Gemini realmente usados (aprox. $0.002/mil tokens)
- Custos de O&M: A auto-hospedagem está sujeita aos custos do servidor (aprox. $5/mês para VPS)
Estratégias de otimização de custos
- mecanismo de cache::
- Habilitar o cache de resultados para conteúdo de URL idêntico
- Definir TTL para 24 horas
- Seleção de modelos::
- Gemini-pro preferencialmente para conteúdo em inglês (30% de baixo custo)
- O GPT-3.5-turbo está disponível para tarefas de classificação simples.
- arquivo de lote::
- configurar
ffun workers(usado em uma expressão nominal)--batch-size=50parâmetros - Reduzir as chamadas de API com a consolidação de solicitações
- configurar
O custo otimizado da API para o processamento de 10.000 itens de notícias por mês foi testado para estar dentro de $2.
Essa resposta foi extraída do artigoFeeds.Fun: feeds RSS que marcam e filtram automaticamente as notíciasO































