文書の長期アーカイブのために設計されたOCRmyPDFのソリューションは、コンプライアンスに準拠した保存を実現します:
- PDF/Aフォーマット(ISO 19005標準)のデフォルト生成。これは、特に長期アーカイブ用に設計されたPDFのサブセットです。
- とおす
--output-type pdfa
出力がPDF/Aに準拠していること - 画像フォーマットの変換やフォントの埋め込みなど、ドキュメント内の非標準要素の自動処理
- 重要な文書情報を見逃さないよう、メタデータの保持をサポート。
- 提供
--clean-final
一時的なデータや冗長な情報をさらに削除するオプション
これらの機能により、OCRmyPDFは、法的文書、財務記録、その他準拠したアーカイブを必要とするシナリオに理想的なものとなり、何十年もの間、読み取り可能な文書を生成します。
この答えは記事から得たものである。OCRmyPDF: スキャンしたPDFをオープンソースツールの検索可能なテキストへについて