Posição atual:fig. início » Notícias sobre IA

Google lança o mais recente modelo de incorporação Gemini: MTEB analisa a lista de abatedouros multilíngues

2025-07-16

1.1 K

Google anunciou recentemente que seu primeiro Gemini Embedding Modelagem de texto (gemini-embedding-001) Adotada Gemini API 和 Vertex AI oficialmente aberto aos desenvolvedores. Desde seu lançamento experimental em março de 2025, o modelo tem estado em MTEB (Massive Text Embedding Benchmark) multilíngue, indicando seu desempenho superior em tarefas de missão crítica entre domínios.

谷歌发布 Gemini Embedding 模型：性能领先与成本灵活性的双重博弈-1

Importância da avaliação comparativa do desempenho do MTEB

MTEB é uma referência confiável para os recursos abrangentes dos modelos de incorporação de texto que cobrem uma ampla gama de tarefas com diferentes dimensões, desde a recuperação de informações até a categorização de textos.gemini-embedding-001 A liderança sustentada nesse benchmark significa que o modelo não se destaca apenas em cenários específicos, mas tem uma representação semântica unificada e robusta em diversos domínios, como ciência, direito, finanças e programação. De acordo com o Google Relatórios publicados.gemini-embedding-001 O desempenho não apenas supera o de seus próprios modelos mais antigos, mas também o de outros modelos disponíveis comercialmente no mercado em várias dimensões.

Tecnologia principal: Matryoshka e flexibilidade de custos

Uma técnica essencial do modelo é Matryoshka Representation Learning (MRL). Essa técnica permite que os desenvolvedores reduzam de forma flexível a dimensão de saída dos vetores de incorporação de acordo com as necessidades reais, com uma dimensão padrão de 3072.

Esse design é extremamente amigável para o desenvolvedor. Em cenários em que a mais alta precisão é necessária, como a correspondência exata de documentos financeiros ou jurídicos, as dimensões completas de 3072 podem ser usadas. Em aplicativos mais sensíveis ao custo e ao armazenamento, ele pode ser reduzido para 1536 ou 768 ou até mesmo para dimensões menores, encontrando o equilíbrio ideal entre desempenho e custos operacionais. Essa flexibilidade, combinada com o suporte a mais de 100 idiomas e um limite de entrada de até 2048 tokens, faz dele um modelo altamente versátil.

Ecologia do desenvolvedor e estratégia de preços

Google Oferece aos desenvolvedores um caminho claro para o acesso e preços competitivos.gemini-embedding-001 O preço é por 1 milhão de insumos token 0,15 e oferece créditos de uso gratuitos para facilitar a experimentação e a criação de protótipos pelos desenvolvedores.

Os desenvolvedores podem usar o Gemini API invoca o modelo e é compatível com o embed_content Compatibilidade com endpoints.

from google import genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="What is the meaning of life?"
)
print(result.embeddings)

Ao mesmo tempo.Google também publicou um plano de migração para o modelo antigo.embedding-001 deixará de ser suportado em 14 de agosto de 2025, e o text-embedding-004 A ser abandonado em 14 de janeiro de 2026.Google Recomenda-se explicitamente que os desenvolvedores migrem seus projetos para a versão mais recente do gemini-embedding-001 Modelo em.

Essa mudança não é apenas uma iteração técnica do Google uma etapa importante na consolidação de seu ecossistema de IA. Um modelo de incorporação robusto, flexível e com controle de custos é a chave para a criação de um sistema de IA de alto nível. RAG (Retrieval-Augmented Generation) e outros aplicativos. Ao fornecer aos desenvolvedores uma ferramenta tão fundamental, oGoogle está aprimorando sua competitividade no espaço de infraestrutura de IA. Além disso, aGoogle Também pré-visualizado e prestes a receber suporte Batch APIO sistema de processamento de dados é um sistema de processamento de dados assíncrono a um custo muito menor, o que reduzirá ainda mais o limite para aplicativos de grande escala.

Não pode ser reproduzido sem permissão:Ferramentas de produtividade de IA » Google lança o mais recente modelo de incorporação Gemini: MTEB analisa a lista de abatedouros multilíngues

Google lança o mais recente modelo de incorporação Gemini: MTEB analisa a lista de abatedouros multilíngues

Importância da avaliação comparativa do desempenho do MTEB

Tecnologia principal: Matryoshka e flexibilidade de custos

Ecologia do desenvolvedor e estratégia de preços

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

Google lança o mais recente modelo de incorporação Gemini: MTEB analisa a lista de abatedouros multilíngues

Importância da avaliação comparativa do desempenho do MTEB

Tecnologia principal: Matryoshka e flexibilidade de custos

Ecologia do desenvolvedor e estratégia de preços

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

Ferramenta de IA da estação de consulta rápida