SmolDoclingの標準出力DocTagsは、docling_coreライブラリを使用して、複数のフォーマットに変換できます:
基本的な変換方法
- マークダウンへ使用
export_to_markdown()ヘッダー階層とコードブロックを完全に保持するメソッド - HTMLへウェブでの公開に適しています。
- LaTeXへアカデミック・ユーザーは数式に使用できます。
高度な加工技術
- 複数ページのドキュメントをマージします。
Document.merge() - スタイルのカスタマイズ:CSSテンプレートの修正によるHTML出力スタイルの調整
- バッチ変換:globモジュールと連携したフォルダのバッチ処理
変換例コード:doc = DoclingDocument(name="报告")
doc.load_from_doctags(doctags)
with open("output.md", "w") as f:
f.write(doc.export_to_markdown())
この答えは記事から得たものである。SmolDocling:少量で効率的な文書処理のための視覚言語モデルについて





























