Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito

Google lança o mais recente modelo de incorporação Gemini: MTEB analisa a lista de abatedouros multilíngues

2025-07-16 33

Google anunciou recentemente que seu primeiro Gemini Embedding Modelagem de texto (gemini-embedding-001) Adotada Gemini API responder cantando Vertex AI oficialmente aberto aos desenvolvedores. Desde seu lançamento experimental em março de 2025, o modelo tem estado em MTEB (Massive Text Embedding Benchmark) multilíngue, indicando seu desempenho superior em tarefas de missão crítica entre domínios.

O Google lança o modelo de incorporação Gemini: o jogo duplo de liderança de desempenho e flexibilidade de custos-1

 

Importância da avaliação comparativa do desempenho do MTEB

MTEB é uma referência confiável para os recursos abrangentes dos modelos de incorporação de texto que cobrem uma ampla gama de tarefas com diferentes dimensões, desde a recuperação de informações até a categorização de textos.gemini-embedding-001 A liderança sustentada nesse benchmark significa que o modelo não se destaca apenas em cenários específicos, mas tem uma representação semântica unificada e robusta em diversos domínios, como ciência, direito, finanças e programação. De acordo com o Google Relatórios publicados.gemini-embedding-001 O desempenho não apenas supera o de seus próprios modelos mais antigos, mas também o de outros modelos disponíveis comercialmente no mercado em várias dimensões.

Tecnologia principal: Matryoshka e flexibilidade de custos

Uma técnica essencial do modelo é Matryoshka Representation Learning (MRL). Essa técnica permite que os desenvolvedores reduzam de forma flexível a dimensão de saída dos vetores de incorporação de acordo com as necessidades reais, com uma dimensão padrão de 3072.

Esse design é extremamente amigável para o desenvolvedor. Em cenários em que a mais alta precisão é necessária, como a correspondência exata de documentos financeiros ou jurídicos, as dimensões completas de 3072 podem ser usadas. Em aplicativos mais sensíveis ao custo e ao armazenamento, ele pode ser reduzido para 1536 ou 768 ou até mesmo para dimensões menores, encontrando o equilíbrio ideal entre desempenho e custos operacionais. Essa flexibilidade, combinada com o suporte a mais de 100 idiomas e um limite de entrada de até 2048 tokens, faz dele um modelo altamente versátil.

Ecologia do desenvolvedor e estratégia de preços

Google Oferece aos desenvolvedores um caminho claro para o acesso e preços competitivos.gemini-embedding-001 O preço é por 1 milhão de insumos token 0,15 e oferece créditos de uso gratuitos para facilitar a experimentação e a criação de protótipos pelos desenvolvedores.

Os desenvolvedores podem usar o Gemini API invoca o modelo e é compatível com o embed_content Compatibilidade com endpoints.

from google import genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="What is the meaning of life?"
)
print(result.embeddings)

Ao mesmo tempo.Google também publicou um plano de migração para o modelo antigo.embedding-001 deixará de ser suportado em 14 de agosto de 2025, e o text-embedding-004 A ser abandonado em 14 de janeiro de 2026.Google Recomenda-se explicitamente que os desenvolvedores migrem seus projetos para a versão mais recente do gemini-embedding-001 Modelo em.

Essa mudança não é apenas uma iteração técnica do Google uma etapa importante na consolidação de seu ecossistema de IA. Um modelo de incorporação robusto, flexível e com controle de custos é a chave para a criação de um sistema de IA de alto nível. RAG (Retrieval-Augmented Generation) e outros aplicativos. Ao fornecer aos desenvolvedores uma ferramenta tão fundamental, oGoogle está aprimorando sua competitividade no espaço de infraestrutura de IA. Além disso, aGoogle Também pré-visualizado e prestes a receber suporte Batch APIO sistema de processamento de dados é um sistema de processamento de dados assíncrono a um custo muito menor, o que reduzirá ainda mais o limite para aplicativos de grande escala.

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

caixa de entrada

Entre em contato conosco

voltar ao topo

pt_BRPortuguês do Brasil