Um SmolDocling zu installieren, folgen Sie diesen Schritten:
- Vorbereitung der UmweltStellen Sie sicher, dass Python 3.8+ installiert ist, eine virtuelle Umgebung wird empfohlen.
- Installation von AbhängigkeitenAusführen des Befehls
pip install torch transformers docling_core - GPU-Beschleunigung(Optional): Installieren Sie die CUDA-Version von PyTorch für Geschwindigkeit, verfügbar über die
torch.cuda.is_available()Nachweis der Unterstützung
Der Verwendungsprozess ist in fünf Phasen unterteilt:
- Bild laden: Verwendung
load_image()Funktion zum Importieren des zu bearbeitenden Bildes - Initialisierung des ModellsAutomatisches Herunterladen von Modellgewichten über Hugging Face (erfordert anfängliche Internetverbindung)
- Konvertierung von DokumentenDocTags mit einer bestimmten Prompt-Vorlage generieren
- FormatkonvertierungDocTags in gängige Formate wie Markdown exportieren.
- Erweiterte OptimierungGPU-Benutzer können flash_attention_2 beschleunigte Verarbeitung aktivieren
Beachten Sie, dass bei der Verarbeitung großer Bilder möglicherweise Anpassungen erforderlich sind. max_new_tokens (Standardwert 8192) ist es empfehlenswert, die Zwischenergebnisse zur Fehlersuche auszudrucken, wenn Sie das Programm zum ersten Mal verwenden.
Diese Antwort stammt aus dem ArtikelSmolDocling: ein visuelles Sprachmodell für die effiziente Verarbeitung von Dokumenten in einem kleinen VolumenDie





























