Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito

O Google revela as contas de energia do modelo Gemini pela primeira vez

2025-08-27 706

Quando o cientista-chefe do Google Jeff Dean e vice-presidente de infraestrutura de IA Amin Vahdat Quando os co-signatários divulgaram um relatório técnico, todo o setor ouviu. A mensagem central do relatório foi embalada em uma metáfora altamente comunicativa: processar um Gemini modela instruções textuais que consomem menos energia do que assistir a 9 segundos de televisão.

Essa analogia é vívida e relacionável, retratando de forma inteligente o custo de uma única interação de IA como insignificante. No entanto, essa perspectiva microscópica, endossada pelos próprios líderes do setor, desmente as demandas surpreendentes de energia da tecnologia de IA em escala global. Quando o pequeno consumo individual é multiplicado pelo número astronômico de consultas diárias, a história é bem diferente.

图像

Por que "mediana"? Uma escolha entre honestidade e parcialidade

Antes de nos aprofundarmos, é importante entender por que o Google escolheu a "consulta de texto mediana" como sua métrica principal. Em cada interação do usuário com a IA, desde perguntas simples como "Quantas vezes 2+2 é igual?" a uma tarefa complexa que exige a redação de milhares de palavras em um documento, o consumo de energia varia drasticamente.

Se forem usadas médias, um pequeno número de consultas extremamente complexas pode aumentar drasticamente o valor geral, distorcendo assim o custo real do uso diário para o usuário médio. Por outro lado, a mediana elimina os valores discrepantes em ambas as extremidades do espectro e é mais representativa do consumo de energia de uma consulta típica. O relatório estima que uma mediana Gemini Consumo de consultas de texto 0,24 Watt-hora (Wh) de energia, emite 0,03 gramas de CO2 e usa 0,26 mililitros de água. O Google enfatiza que esta é a primeira vez que uma grande empresa de tecnologia do setor publica o custo do uso de um modelo de linguagem grande de forma tão detalhada.

Os "algoritmos de pilha completa" do Google: mais do que apenas matéria-prima computacional

Outro destaque do relatório é sua abordagem de medição "full-stack". O Google afirma que muitas estimativas públicas contam apenas os aceleradores de IA (como o TPU talvez GPU) durante a computação ativa, o que subestima muito o custo real.

Para usar uma analogia, esse algoritmo otimista é como calcular o custo de uma pizza contando apenas a farinha e os tomates.

E o "algoritmo de pilha completa" do Google contabiliza todos os custos:

  • Consumo de energia do sistema completoIsso inclui não apenas os chips de IA, mas também os servidores host, as CPUs e a memória que dão suporte à sua operação.
  • Sistemas ociosos em esperaEnergia consumida por servidores em modo de espera que são reservados para lidar com picos de tráfego.
  • Despesas gerais do data centerMedição da eficiência energética PUE (eficiência no uso de energia), incluindo todo o consumo adicional de sistemas de resfriamento, distribuição de energia, etc. O Google afirma que sua frota de data centers tem uma média de PUE Com 1,09, ele está em um nível líder do setor.

Com esse algoritmo mais abrangente, oGemini para uma única consulta consome 0,24 watt-hora de energia. O Google admite que esse número poderia ser facilmente reduzido para 0,10 watt-hora se adotasse a abordagem restrita do setor de contar apenas o consumo de energia do chip. [3] A medida é certamente uma tentativa de se vangloriar da transparência e honestidade de seus dados e, ao mesmo tempo, pressionar seus concorrentes.

Por trás do salto de eficiência

O relatório também destaca Gemini Ganhos de eficiência surpreendentes no último ano: menor consumo de energia por consulta e, ao mesmo tempo, respostas de maior qualidade 33 vezesRedução da pegada de carbono 44 vezes.

图像

Esse salto não é um avanço em uma única tecnologia, mas o resultado de sua estratégia de "otimização de pilha completa", que abrange todos os aspectos, desde a arquitetura do modelo até o hardware:

  • Arquitetura de modelo eficiente: Adoção Mixture-of-Experts (MoE) Arquiteturas como essa permitem que o modelo ative somente a parte da rede "especializada" necessária para processar uma solicitação, reduzindo assim a quantidade de cálculos por um fator de 10 a 100.
  • Algoritmos otimizados: através da quantificação (Quantization) e destilação (Distillation) e outras técnicas para criar versões menores e mais rápidas do modelo sem sacrificar muito a qualidade.
  • sistema de raciocínio inteligenteUtilização speculative decoding (decodificação especulativa) e outras técnicas que permitem que modelos pequenos façam previsões primeiro, que depois são rapidamente verificadas por modelos grandes, melhorando consideravelmente a eficiência da resposta.
  • Hardware personalizado: O sistema de desenvolvimento próprio do Google TPU (Tensor Processing Unit) Otimizado desde o início para operações de IA, ele atinge um índice de eficiência energética muito alto.

Para ser justo, o Google merece crédito por suas conquistas de engenharia na redução do custo de uma única consulta de IA. No entanto, se olharmos para além dos "9 segundos" de uma única consulta, veremos um quadro muito diferente.

Perspectiva macro: quando "9 segundos" se somam a "285 anos"

A analogia da "TV de 9 segundos" é inteligente porque capitaliza o senso humano de pequenos custos. Mas o verdadeiro teste é a escala.

Atualmente, não há informações sobre Gemini Não há dados oficiais sobre o número de consultas diárias globais, mas as estimativas do setor variam de 28 milhões a um otimista 1 bilhão. Podemos também usar cada um desses dois números em nossos cálculos.

Cenário 1: 1 bilhão de consultas (estimativa otimista)

  • Consumo diário total de energia: 1 bilhão de ciclos × 0,24 Watt-hora por ciclo = 240 milhões de Watt-hora, ou 240.000 quilowatt-hora (kWh).
  • O que isso significa?Uma família indiana média usa cerca de 3 kWh de eletricidade por dia. Isso significa que Gemini O consumo de energia de um dia é suficiente para sustentar Oitenta mil. Consumo diário de eletricidade em residências indianas.
  • Vamos mudar a metáfora.: é o equivalente a uma pessoa que assiste a uma insônia contínua 285 anos TV.

Cenário 2: 28 milhões de consultas (estimativa conservadora)

  • Consumo diário total de energia: 28 milhões de vezes × 0,24 watt-hora por vez = 6,72 milhões de watt-hora, ou 6.720 quilowatts-hora (kWh).
  • O que isso significa?: Mesmo assim.Gemini Isso é energia suficiente para um dia. 2240 Uso doméstico indiano.
  • Vamos mudar a metáfora.: é o equivalente a assistir a uma sucessão de 8 anos TV.

Seja qual for o cenário, os cálculos revelam a realidade de que a analogia que faz com que um único ato pareça trivial, uma vez colocada na grande escala da globalização, seu verdadeiro impacto é impressionante.

O verdadeiro desafio: os ganhos de eficiência podem acompanhar a explosão da demanda?

Com esse relatório, o Google pretende provar que resolveu o problema técnico do "custo por consulta" e chutou a bola para os outros. No entanto, isso evita precisamente o dilema mais profundo enfrentado pelo setor como um todo.

O verdadeiro desafio vai muito além do pequeno custo de otimizar uma única consulta. Em vez disso, é como atender a esse crescimento exponencial da demanda com fontes de energia sustentáveis à medida que os serviços de IA são totalmente integrados à pesquisa, ao e-mail e até mesmo aos sistemas operacionais, e à medida que o volume de consultas passa de bilhões para centenas de bilhões.

Os avanços tecnológicos trazem eficiência, mas os ganhos de eficiência estimulam uma aplicação mais ampla, levando a uma explosão na demanda agregada. É um clássico "paradoxo de Jevons". O Google afirma estar trabalhando em direção ao seu data center Energia livre de carbono 24 horas por dia, 7 dias por semana objetivos e tem o compromisso de complementar 120% do consumo de água doce. No entanto, globalmente, especialmente em regiões onde o mix de energia ainda não é perfeito, os novos data centers ainda exercerão uma enorme pressão sobre a rede.

Embora os gigantes da tecnologia estejam falando sobre como a IA mudará o mundo, talvez seja mais apropriado que eles tenham uma discussão franca sobre o que impulsionará esse mundo remodelado.

 

Referência: https://arxiv.org/abs/2508.15734

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

Novos lançamentos

voltar ao topo

pt_BRPortuguês do Brasil