SmolDoclingをインストールするには、以下の手順に従ってください:
- 環境準備Python 3.8+がインストールされていることを確認する。
- 依存関係のインストールコマンド実行
pip install torch transformers docling_core - GPUアクセラレーション(オプション): CUDAバージョンのPyTorchをインストールします。
torch.cuda.is_available()サポートの検出
使用プロセスは5段階に分けられる:
- 画像読み込み使用
load_image()処理する画像を取り込む関数 - モデルの初期化ハギング・フェイスを介したモデル・ウエイトの自動ダウンロード(最初のインターネット接続が必要です。)
- 文書変換特定のプロンプト・テンプレートを使ってDocTagsを生成する
- フォーマット変換DocTagsをMarkdownなどの一般的なフォーマットにエクスポートします。
- 高度な最適化GPUユーザーは、flash_attention_2アクセラレーション処理を有効にすることができます。
大きな画像を処理する場合、調整が必要になることがあります。 max_new_tokens パラメーター(デフォルト8192)を初めて使用する場合は、デバッグのために中間結果を表示することを推奨する。
この答えは記事から得たものである。SmolDocling:少量で効率的な文書処理のための視覚言語モデルについて





























