Google
anunciou recentemente que seu primeiro Gemini Embedding
Modelagem de texto (gemini-embedding-001
) Adotada Gemini API
responder cantando Vertex AI
oficialmente aberto aos desenvolvedores. Desde seu lançamento experimental em março de 2025, o modelo tem estado em MTEB
(Massive Text Embedding Benchmark) multilíngue, indicando seu desempenho superior em tarefas de missão crítica entre domínios.
Importância da avaliação comparativa do desempenho do MTEB
MTEB
é uma referência confiável para os recursos abrangentes dos modelos de incorporação de texto que cobrem uma ampla gama de tarefas com diferentes dimensões, desde a recuperação de informações até a categorização de textos.gemini-embedding-001
A liderança sustentada nesse benchmark significa que o modelo não se destaca apenas em cenários específicos, mas tem uma representação semântica unificada e robusta em diversos domínios, como ciência, direito, finanças e programação. De acordo com o Google
Relatórios publicados.gemini-embedding-001
O desempenho não apenas supera o de seus próprios modelos mais antigos, mas também o de outros modelos disponíveis comercialmente no mercado em várias dimensões.
Tecnologia principal: Matryoshka e flexibilidade de custos
Uma técnica essencial do modelo é Matryoshka Representation Learning
(MRL). Essa técnica permite que os desenvolvedores reduzam de forma flexível a dimensão de saída dos vetores de incorporação de acordo com as necessidades reais, com uma dimensão padrão de 3072.
Esse design é extremamente amigável para o desenvolvedor. Em cenários em que a mais alta precisão é necessária, como a correspondência exata de documentos financeiros ou jurídicos, as dimensões completas de 3072 podem ser usadas. Em aplicativos mais sensíveis ao custo e ao armazenamento, ele pode ser reduzido para 1536 ou 768 ou até mesmo para dimensões menores, encontrando o equilíbrio ideal entre desempenho e custos operacionais. Essa flexibilidade, combinada com o suporte a mais de 100 idiomas e um limite de entrada de até 2048 tokens, faz dele um modelo altamente versátil.
Ecologia do desenvolvedor e estratégia de preços
Google
Oferece aos desenvolvedores um caminho claro para o acesso e preços competitivos.gemini-embedding-001
O preço é por 1 milhão de insumos token
0,15 e oferece créditos de uso gratuitos para facilitar a experimentação e a criação de protótipos pelos desenvolvedores.
Os desenvolvedores podem usar o Gemini API
invoca o modelo e é compatível com o embed_content
Compatibilidade com endpoints.
from google import genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="What is the meaning of life?"
)
print(result.embeddings)
Ao mesmo tempo.Google
também publicou um plano de migração para o modelo antigo.embedding-001
deixará de ser suportado em 14 de agosto de 2025, e o text-embedding-004
A ser abandonado em 14 de janeiro de 2026.Google
Recomenda-se explicitamente que os desenvolvedores migrem seus projetos para a versão mais recente do gemini-embedding-001
Modelo em.
Essa mudança não é apenas uma iteração técnica do Google
uma etapa importante na consolidação de seu ecossistema de IA. Um modelo de incorporação robusto, flexível e com controle de custos é a chave para a criação de um sistema de IA de alto nível. RAG
(Retrieval-Augmented Generation) e outros aplicativos. Ao fornecer aos desenvolvedores uma ferramenta tão fundamental, oGoogle
está aprimorando sua competitividade no espaço de infraestrutura de IA. Além disso, aGoogle
Também pré-visualizado e prestes a receber suporte Batch API
O sistema de processamento de dados é um sistema de processamento de dados assíncrono a um custo muito menor, o que reduzirá ainda mais o limite para aplicativos de grande escala.