Fluxo de trabalho completo para que os pesquisadores aprimorem os modelos locais de IA
Os pesquisadores podem usar o Ai2 OLMoE para realizar experimentos completos para aprimoramento do modelo:
- preparação básicaClonagem da base de código OLMoE.swift do GitHub (https://github.com/allenai/OLMoE.swift)
- modelo de pesquisaAtivar o modo de pesquisa no aplicativo para acessar o conjunto de ferramentas avançadas
- Ajustes de modelagemAjuste fino ou modificações arquitetônicas com base no código aberto OLMoE-1B-7B
- Otimização do treinamentoAplicação da estratégia de treinamento híbrido Dolmino e do esquema de otimização Tülu3 para melhorar o desempenho
- Avaliação e validaçãoTeste as melhorias usando o conjunto de avaliação integrado (média de 351 melhorias no desempenho do TP3T)
- Compartilhamento de resultadosIntercâmbio de resultados de pesquisa por meio da comunidade Ai2 Discord
Pesquisadores avançados também podem: visitar o HuggingFace para obter o modelo básico no formato GGUF ou realizar experimentos estendidos em um ambiente de teste local em conjunto com técnicas como vLLM.
Essa resposta foi extraída do artigoAi2 OLMoE: um aplicativo de IA para iOS de código aberto baseado em modelos OLMoE executados off-lineO































