O fluxo de trabalho completo para o processamento de perguntas gráficas de matemática é o seguinte:
- Preparação de dados
Crie um arquivo no formato JSONL contendo:image_urlsaponta para o caminho da imagem local (por exemplofile:///home/user/question.jpg)conversationsO campo armazena a descrição do problema (por exemplo, "Encontre a área da parte sombreada do diagrama")
- raciocínio modelado
executar um comandopython scripts/inference.py --model MM-Eureka-8B --data problem.jsonl - Análise dos resultados
Exemplo de saída:<think>识别出图形由1个矩形和2个半圆组成...</think><answer>38.5cm²</answer>
advertênciaAo trabalhar com formas complexas, como geometria 3D, é recomendável usar o modelo 38B e ativar a função--enable_reflectionO parâmetro ativa a função de reflexão.
Essa resposta foi extraída do artigoMM-EUREKA: uma ferramenta de aprendizagem por reforço multimodal para explorar o raciocínio visualO































