API-Fehlertoleranzlösung
Um einen stabilen Langzeitbetrieb zu gewährleisten, werden die folgenden Schutzmaßnahmen empfohlen:
- Multi-API-Redundanz::
- existieren
config/Konfigurieren Sie die alternativen Schlüssel für Google Vision und MathPix in der - passieren (eine Rechnung oder Inspektion etc.)
--fallback_api mathpix:3,google:2Einstellung der Anzahl der fehlgeschlagenen Wiederholungsversuche
- existieren
- lokaler Cache::
- .
--cache_dir ./api_cache/Automatische Speicherung der erkannten Inhalte - erhöhen.
--cache_ttl 86400Einstellen einer 1-tägigen Cache-Gültigkeit
- .
- Flusskontrolle::
- ausnutzen
--rate_limit 50/分钟Vermeiden Sie die Auslösung von API-Beschränkungen - Hinzufügen von Dokumenten mit mehr als 10.000 Seiten
--sleep_interval 1.2Latenzzeit
- ausnutzen
- Start-Stopp-Getriebe::
- Phase 1 nach Bearbeitungsunterbrechungen verfügbar
--resume_from temp/last_processed.pageWiederaufnahme - passieren (eine Rechnung oder Inspektion etc.)
--checkpoint_interval 20Fortschritt alle 20 Seiten speichern
- Phase 1 nach Bearbeitungsunterbrechungen verfügbar
Notlösung: Umschalten auf rein lokalen Modus, wenn API nicht verfügbar ist--local_only, aber die Erkennungsgenauigkeit der Formeln nimmt um 15-20% ab.
Diese Antwort stammt aus dem ArtikelVOP: OCR-Tool zum Extrahieren komplexer Diagramme und mathematischer FormelnDie
































