PDF Craftは、単一のテキスト変換の限界を突破し、グラフィカルなレイアウト、表の保持、章構成を含むマルチモーダルなMarkdown出力を実現します。その画像処理モジュールは、適応しきい値セグメンテーション技術を使用して、スキャンされたドキュメント内のグラフィック要素をインテリジェントに識別し、元の解像度のスクリーンショットを維持し、自動的にMarkdown埋め込みコードを生成します。実際には、200の技術的な図版を含む専門書の場合、システムは95%以上の画像参照の精度を維持し、自動的にalt-text記述を生成することができます。拡張機能は、EPUB標準電子書籍フォーマットの出力をサポートし、pandocトランスコーディングエンジンを通じて、フォント保持、目次生成、およびその他の出版レベルの機能を実現するため、個人ユーザーも商業電子書籍の基準を満たすデジタルドキュメントを作成できます。
この答えは記事から得たものである。PDF Craft: PDFスキャン文書からMarkdownへのオープンソースツールについて































