Guavaインテリジェント文書認識の概要
Guava Intelligent Document Recognition (intelligent_document_recognition)は、GitHubでホストされている開発者jiangnanboyによるオープンソースのデスクトップソフトウェアで、文書やフォームをインテリジェントに認識し、オフラインで処理することに重点を置いている。このソフトウェアは、光学式文字認識(OCR)とフォーム構造認識を統合しており、データのプライバシーとセキュリティを確保するためにオンラインで実行する必要はありません。
コア機能
- オフラインOCR認識インターネットに接続することなく、画像やPDFからテキストを抽出します。
- フォーム構造の識別フォームの内容を自動的に解析し、htmlまたはexcel形式で出力します。
- スクリーンショット認識(v2.1の新機能): マウスボックスで画面内容をリアルタイムでテキスト抽出。
- 画像リスト管理左サイドバーの画像ファイルの削除に対応。
- マルチフォーマット出力認識結果はtxt、html、excelファイルで保存できます。
- 中国語-英語インターフェース中国語版と英語版があり、ユーザーフレンドリーなインターフェース。
この答えは記事から得たものである。Guava Intelligent Document Recognition: オフライン文書・フォームのインテリジェント認識ツールについて




























