ダイアグラムや回路図を使って作業する場合 (--mode figureパラメータ)、VOPは多層的なインテリジェント分析を生成する:
1.基本要素の識別
- チャートタイプ判定折れ線グラフ、棒グラフ、フローチャートなどを自動的に区別します。
- キー・データ・ポイントの抽出軸の値の範囲、凡例の説明などをキャプチャします。
2.意味的記述
典型的な出力例:
- 2010年から2020年までの世界の気温変化の折れ線グラフ。
- "プロフェーズ、メタフェーズ、メタフェイズ、メタフェーズの4段階をラベル付けした細胞分裂の模式図"
3.構造化データ
JSON出力には以下のフィールドが含まれる:{
"type": "scatter_plot",
"x-axis": {"label": "Year", "range": [2000,2020]},
"series": [{"name": "Tokyo", "data": [...]}]
"description": "..."
}
この機能は、生物学の教科書の模式図を注釈付きデータに変換するなど、AIのトレーニングデータセットを構築するのに特に適している。
この答えは記事から得たものである。VOP: 複雑な図や数式を抽出するOCRツールについて
































