DocTagsは、開発チームによって特別に設計され、JSON-LDセマンティックフレームワークを使用して構築された構造化ドキュメントマークアップ言語です。テキスト・コンテンツは元の位置座標情報を保持し、文書要素間の関係はトポロジカル・マッピングによって表現され、数式やコードなどの特殊なコンテンツは標準化されたコンテンツ・タグを使用します。この設計は、97%の情報忠実度を達成するための自動処理をサポートしながら、人間の読みやすさを維持する。
実際には、DocTagsは、サポートしているdocling_coreライブラリを通して、ワンクリックでMarkdown、HTML、LaTeXなどの12の一般的なフォーマットに変換することができます。テストデータによると、DocTagsからMarkdownへの変換効率は、構造情報を失うことなく、1秒間に2000のマークアップアイテムに達します。このフォーマットはまた、バージョン追跡とインクリメンタルアップデートをサポートしており、共同文書編集シナリオに特に適しています。
この答えは記事から得たものである。SmolDocling:少量で効率的な文書処理のための視覚言語モデルについて






























