Um SmolDocling zu installieren, folgen Sie diesen Schritten:
- Vorbereitung der UmweltStellen Sie sicher, dass Python 3.8+ installiert ist, eine virtuelle Umgebung wird empfohlen.
- Installation von AbhängigkeitenAusführen des Befehls pip install torch transformers docling_core
- GPU-Beschleunigung(Optional): Installieren Sie die CUDA-Version von PyTorch für Geschwindigkeit, verfügbar über die torch.cuda.is_available()Nachweis der Unterstützung
Der Verwendungsprozess ist in fünf Phasen unterteilt:
- Bild laden: Verwendung load_image()Funktion zum Importieren des zu bearbeitenden Bildes
- Initialisierung des ModellsAutomatisches Herunterladen von Modellgewichten über Hugging Face (erfordert anfängliche Internetverbindung)
- Konvertierung von DokumentenDocTags mit einer bestimmten Prompt-Vorlage generieren
- FormatkonvertierungDocTags in gängige Formate wie Markdown exportieren.
- Erweiterte OptimierungGPU-Benutzer können flash_attention_2 beschleunigte Verarbeitung aktivieren
Beachten Sie, dass bei der Verarbeitung großer Bilder möglicherweise Anpassungen erforderlich sind. max_new_tokens (Standardwert 8192) ist es empfehlenswert, die Zwischenergebnisse zur Fehlersuche auszudrucken, wenn Sie das Programm zum ersten Mal verwenden.
Diese Antwort stammt aus dem ArtikelSmolDocling: ein visuelles Sprachmodell für die effiziente Verarbeitung von Dokumenten in einem kleinen VolumenDie































 Deutsch
Deutsch				 简体中文
简体中文					           English
English					           日本語
日本語					           Português do Brasil
Português do Brasil