O PhysUniBenchmark tem um suporte avançado para problemas multimodais, principalmente:
- Cobertura do assuntoCobertura abrangente das principais áreas da física de graduação, como mecânica clássica (cinemática, dinâmica), eletromagnetismo (campos eletrostáticos, circuitos elétricos), óptica (óptica geométrica, óptica flutuante), fundamentos da termodinâmica e mecânica quântica
- diversidade de tópicos::
- Perguntas de descrição textual: perguntas que exigem compreensão conceitual e derivação de fórmulas
- Perguntas sobre imagens: inclua elementos visuais, como diagramas de análise de força e diagramas de caminho óptico
- Perguntas compostas: por exemplo, problemas de mecânica que combinam diagramas de velocidade e tempo com descrições textuais
- formato de dados::
- Dados estruturados: usando modelos JSON para armazenar perguntas e respostas
- Arquivos de imagem: gráficos e diagramas em formato PNG/JPG
- Expressões matemáticas: fórmulas e símbolos no formato LaTeX
Esse design multimodal testa com eficácia a capacidade do modelo de correlacionar informações entre modalidades, compreender visualizações conceituais, processar notação matemática e sintetizar o raciocínio. O conjunto de dados também permite que o usuário valide a compatibilidade do formato das perguntas personalizadas por meio do validate_data.py.
Essa resposta foi extraída do artigoPhysUniBenchmark: ferramenta de benchmarking para problemas de física multimodalO































