Docstrangeのインストールと使用方法は以下の通りです:
- Python 3.8以上がインストールされていることを確認する。
- Docstrangeライブラリをpip経由でインストールする:
pip install docstrange
- 処理モードを選択します:
- クラウドモード (デフォルト): 追加の設定は必要ありませんが、ナノネットに登録してAPIキーを取得することで、制限を増やすことができます。
- ネイティブモード:OCRの依存関係(Ollamaなど)をインストールする必要があります。
--cpu-mode
もしかしたら--gpu-mode
パラメトリック
- Python APIまたはコマンドラインからドキュメントを操作する
例えば、基本的なPDF to Markdownコマンド:docstrange document.pdf --output markdown
より詳細な使い方はGitHubのドキュメントを参照されたい。
この答えは記事から得たものである。Docstrange: ドキュメントや画像からデータを抽出し、複数のフォーマットに変換するツール。について