Derzeitige Position:Abb. Anfang " AI-Antworten

Was ist bei der Verarbeitung von Dokumenten mit SmolDocling zu beachten?

2025-08-28

1.8 K

Um ein optimales Ergebnis zu erzielen, sind die folgenden Punkte zu beachten:

Qualität der EingabeDie Auflösung des Bildes sollte mindestens 300 dpi betragen, wobei starke Lichtreflexionen zu vermeiden sind. Die Handschrift sollte klar sein
Hardware-KonfigurationMindestens 4 GB Arbeitsspeicher sind erforderlich, um Dokumente im A4-Format zu verarbeiten, und bei sehr großen Dateien wird empfohlen, sie zu beschneiden.
Parametrisierung: Bei komplexen Dokumenten muss der Wert für max_new_tokens erhöht werden, die Tabelle kann auf 16384 gesetzt werden, wenn die dichte

Lösungen für allgemeine Probleme:

Fehlender Inhalt: Prüfen Sie, ob das Token-Limit erreicht wurde oder ob das Bild verzerrt ist.
Formatierungsfehler: Aktualisieren Sie die docling_core-Bibliothek auf die neueste Version.
GPU nicht aktiviert: Stellen Sie sicher, dass PyTorch für CUDA installiert ist!

Für Unternehmensanwendungen wird dies empfohlen:

Einrichtung eines Bildvorverarbeitungsablaufs (automatisches Zuschneiden/Verbessern)
Feinabstimmung der Eingabeaufforderungsvorlage für bestimmte Dokumenttypen
Regelmäßige Bereinigung des Modell-Caches (standardmäßig in ~/.cache/huggingface/ gespeichert)

Schnellabfragestation AI-Tool