dots.ocrのDocker環境のデプロイは、以下のステップに分かれる:
- コードリポジトリをクローンする:
git clone https://github.com/rednote-hilab/dots.ocr.git
- プロジェクト・ディレクトリに移動し、依存関係をインストールする:
cd dots.ocr && pip install -e .
- 公式のビルド済みイメージを使用する(オプション):ローカルインストールで問題が発生した場合、Dockerイメージを直接引っ張ってきて環境を素早く起動することができます。
注:モデルのウェイトはdownload_model.py
スクリプトは個別にダウンロードされ、保存パスのフォルダ名にはピリオドを含めないようにする(DotsOCRを推奨)。本番環境では、最適な推論パフォーマンスを得るために、vLLMフレームワークと組み合わせて導入することを推奨します。
この答えは記事から得たものである。dots.ocr: 多言語文書レイアウト解析のための統一された視覚言語モデルについて