グラフィカルな数学問題を処理するための完全なワークフローは以下の通りです:
- データ準備
JSONL形式のファイルを作成する:image_urlsフィールドはローカル画像パス(例えばfile:///home/user/question.jpg)conversationsフィールドには問題の説明が格納されます(例:「図の斜線部分の面積を求めよ」)。
- モデル化された推論
コマンドを実行するpython scripts/inference.py --model MM-Eureka-8B --data problem.jsonl - 結果の分析
出力例:<think>识别出图形由1个矩形和2个半圆组成...</think><answer>38.5cm²</answer>
ほら3Dジオメトリのような複雑な形状を扱う場合は、38Bモデルを使用することをお勧めします。--enable_reflectionこのパラメータは反射機能を有効にする。
この答えは記事から得たものである。MM-EUREKA:視覚的推論を探求するマルチモーダル強化学習ツールについて































