Posição atual:fig. início " Respostas da IA

O recurso de adaptação de hardware da estrutura Ollama amplia os limites de aplicativos do XRAG

2025-09-10

1.9 K

Link diretoVisualização móvel

O suporte de computação heterogênea da Ollama permite que o XRAG seja executado com eficiência em diferentes plataformas de hardware, como GPUs NVIDIA, aceleradores AMD e chips Apple M-series. Sua capacidade de selecionar automaticamente o nível de quantificação ideal permite que o XRAG execute 13 bilhões de modelos paramétricos quantificados até mesmo em uma RTX 3060 (6 GB de memória gráfica). Testes práticos mostram que o XRAG habilitado para Ollama ainda pode atingir uma velocidade de inferência de 15 tokens/s em CPUs Intel i9-13900K para atender aos requisitos de interação em tempo real. Essa adaptabilidade de hardware permite que o XRAG seja implantado em uma variedade de ambientes, como dispositivos de borda, servidores privados etc., resolvendo o problema da forte dependência do sistema RAG tradicional da computação em nuvem.

Essa resposta foi extraída do artigoXRAG: uma ferramenta de avaliação visual para otimizar os sistemas de geração de aprimoramento de recuperaçãoO

Não pode ser reproduzido sem permissão:Ferramentas de produtividade de IA " O recurso de adaptação de hardware da estrutura Ollama amplia os limites de aplicativos do XRAG