Einschränkungen und Vorsichtsmaßnahmen für die Verwendung
Um eine optimale Nutzung zu gewährleisten, sollten folgende Punkte besonders beachtet werden:
Technische Sachzwänge
- Anforderungen an die Formatierung von DokumentenEs muss sich um ein textbasiertes PDF handeln (gescannte Bild-PDFs können nicht verarbeitet werden).
- Unterstützung der chinesischen SpracheEs unterstützt zwar die chinesische Konvertierung, aber der Pfad, der Chinesisch enthält, kann einen Fehler melden.
- Netzabhängigkeit: Netzwerkverbindung muss aufrechterhalten werden, um OpenAI APIs aufzurufen
Nutzungsnormen
- API-Schlüssel-SicherheitSchlüssel nicht fest im Skript kodieren, es wird empfohlen, ihn über eine Umgebungsvariable zu übergeben
- Umgang mit großen DateienStapelkonvertierung: Die Stapelkonvertierung wird für Dokumente mit mehr als 50 Seiten empfohlen.
- Validierung der ErgebnisseSpezielle Elemente wie mathematische Formeln sollten nach der ersten Konvertierung auf ihre Richtigkeit überprüft werden.
Lösungen für allgemeine Probleme
| problematisches Phänomen | Prüfschritt |
|---|---|
| Konvertierungsergebnis ist verstümmelt | Prüfen, ob die PDF-Datei verschlüsselt ist oder spezielle Schriftarten enthält |
| Falsche Ausrichtung der Formularerkennung | Versuchen Sie, den Parameter für die Formularerkennung in main.py anzupassen |
| Fehlerhafter API-Aufruf | Bestätigung der Schlüsselgültigkeit und des Saldostatus |
Bei hartnäckigen Problemen empfiehlt es sich, auf der GitHub-Projektseite einen Fehler zu melden und einen Testfall anzugeben.
Diese Antwort stammt aus dem ArtikelMarkPDFDown: Konvertierung von PDF in Markdown basierend auf einem multimodalen ModellDie































