AI Professional Tools

 Website einreichen

dots.ocr: ein vereinheitlichtes visuell-linguistisches Modell für die Analyse von mehrsprachigem Dokumentenlayout
dots.ocr ist ein leistungsfähiges, mehrsprachiges Dokument-Parsing-Tool, das auf einem visuell-linguistischen Modell (VLM) mit 1,7 B Parametern basiert und sowohl Layout-Erkennung als auch Inhaltserkennung beherrscht. Es zeigt in Benchmarks wie OmniDocBench die beste Leistung, insbesondere beim Parsen von Text, Tabellen und Lesereihenfolge...
9.5 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
SnippAI: Ein Tool zur Erkennung und Analyse von Screenshot-Inhalten mithilfe von KI
Snippai ist ein KI-basiertes Screenshot-Tool, das durch fortschrittliche KI-Algorithmen das Screenshot-Erlebnis verbessern soll. Es erfasst nicht nur Bildschirminhalte, sondern analysiert und konvertiert auch auf intelligente Weise Formeln, Text, Tabellen, Bilder usw. im Screenshot. Benutzer können mit Snippai komplexe visuelle Informationen in editierbare Formate wie LaTeX-Formeln umwandeln...
3.9 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
AI Fast Station: ein Tool zum Parsen von Dokumenten für den Vergleich von OCR-Modellen mit einem Klick
AI Fast Station ist eine kostenlose Open-Source-OCR-Modellarena, die sich auf das intelligente Parsing von Dokumenten und Bildern konzentriert. Benutzer können PDF- oder Bilddateien hochladen und durch den Vergleich von sieben gängigen OCR-Modellen mit einem Klick schnell eine geeignete Parsing-Lösung finden. Die Website unterstützt eine breite Palette von Formatdateien, einfach zu bedienen, ohne komplexe Installation.AI Fast Station bietet hochpräzise Erkennung, schnelle Verarbeitung und Sicherheit...
3.5 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
OCRmyPDF: gescanntes PDF in durchsuchbaren Text des Open-Source-Tools
OCRmyPDF ist ein Open-Source-Befehlszeilen-Tool zum Hinzufügen einer OCR-Textebene (Optical Character Recognition) zu gescannten PDF-Dateien, wodurch sie in durchsuchbare, reproduzierbare Dokumente verwandelt werden. Es basiert auf Python-Entwicklung, mit der Tesseract OCR-Engine, kann genau den Text im Bild zu identifizieren und in der PDF eingebettet, halten ...
1.2 Wdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Docstrange: ein Tool zum Extrahieren von Daten aus Dokumenten und Bildern und deren Konvertierung in verschiedene Formate
Docstrange ist ein Open-Source-Dokumentenverarbeitungswerkzeug, das sich auf die Extraktion von Daten aus Dokumenten und Bildern in verschiedenen Formaten und deren Konvertierung in Formate wie Markdown, JSON, CSV oder HTML konzentriert. Es verwendet künstliche Intelligenz und fortschrittliche OCR-Technologie, Unterstützung für die Verarbeitung von PDF, Word-Dokumenten, Exce...
5.6 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Guava Intelligent Document Recognition: Intelligentes Erkennungsprogramm für Offline-Dokumente und Formulare
Guava Intelligent Document Recognition (intelligent_document_recognition) ist eine Open-Source-Desktop-Software, die vom Entwickler jiangnanboy entwickelt wurde und auf GitHub gehostet wird und sich auf die intelligente Erkennung von offline zu verarbeitenden Dokumenten und Formularen konzentriert. Die Software integriert Optical Character Recognition (OCR) und Formularverknüpfung...
2.9 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
OCRFlux: Leichtes Tool zur Konvertierung von PDFs und Bildern in Markdown
OCRFlux ist ein quelloffenes, leichtgewichtiges Tool, das sich auf die Konvertierung von PDF-Dateien und Bildern in das klare Markdown-Format konzentriert. Es wurde vom ChatDOC-Team entwickelt, basiert auf einem großen multimodalen Modell mit 3B-Parametern und kann auf gängiger Hardware wie der GTX 3090 laufen. Das Tool zeichnet sich durch die Handhabung komplexer Dokumentenlayouts,...
4.1 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
VOP: OCR-Tool zum Extrahieren komplexer Diagramme und mathematischer Formeln
Versatile OCR Program ist ein Open-Source-Tool für die optische Zeichenerkennung (OCR), das für die Verarbeitung komplexer akademischer und pädagogischer Dokumente entwickelt wurde. Es kann Text, Tabellen, mathematische Formeln, Diagramme und Schemata aus PDF-, Bild- und anderen Dokumenten extrahieren und strukturierte Daten erzeugen, die sich für das Training von maschinellem Lernen eignen. Unterstützt mehrere Sprachen, einschließlich Englisch...
4.1 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Automatisches Parsen von PDF-Inhalten und Extrahieren von Text und Tabellen von Open-Source-Diensten
Es analysiert automatisch das Layout von PDF-Dokumenten, identifiziert Text, Titel, Bilder, Tabellen, Formeln und andere Elemente auf der Seite und bestimmt ihre richtige Reihenfolge. Das Tool unterstützt OCR-Funktionalität, Sie können gescannte PDFs in durchsuchbaren Text umwandeln. Es läuft auf Docker und bietet zwei Modelle: visuelles Modell (Vision Grid Transfor...
4.6 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Bob.
Bob ist eine Übersetzungs- und OCR-Software (Optical Character Recognition), die für die macOS-Plattform entwickelt wurde. Benutzer können Bob für die Übersetzung und OCR-Operationen in jeder Anwendung verwenden und unterstützen eine breite Palette von Übersetzungsdiensten, einschließlich Volcano, Tencent, Ali, Baidu, Youdao, Apple, Google, Microsoft,...
4.5 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Ollama OCR: Extrahieren von Text aus Bildern mithilfe visueller Modelle in Ollama
Ollama OCR ist ein leistungsstarkes Toolkit für die optische Zeichenerkennung (OCR), das das hochmoderne visuelle Sprachmodell der Ollama-Plattform nutzt, um Text aus Bildern zu extrahieren. Das Projekt ist sowohl als Python-Paket verfügbar als auch mit einer benutzerfreundlichen Streamlit-Webanwendungsschnittstelle. Es unterstützt eine breite Palette von visuellen Modellen, einschließlich...
8.3 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Doc2X
Doc2X ist ein leistungsfähiges Werkzeug zur Erkennung und Konvertierung von Dokumentenbildern und Formeln, das sich der Bereitstellung effizienter und intelligenter Lösungen für die Dokumentenverarbeitung verschrieben hat. Ob es sich um eine akademische Forschungsarbeit, Lehrbücher, Unternehmensdokumente oder Finanzberichte handelt, Doc2X kann Formulare und Formeln in PDF genau erkennen und sie in Word, LaTeX, HTML,...
4.2 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
STranslate
STranslate ist ein gebrauchsfertiges Übersetzungs- und OCR-Tool, das von WPF entwickelt wurde. Das Tool wurde entwickelt, um eine effiziente und bequeme Übersetzung und optische Zeichenerkennung (OCR) Funktionalität für eine breite Palette von Sprachen und Texttypen zu bieten.STranslate ist ein Open-Source-Projekt, das kostenlos für Benutzer zum Download und zur Verwendung ist, und akzeptiert auch kundenspezifische Entwicklung...
3.9 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Llama OCR: OCR-Bibliothek, die Bilder in drei Zeilen Code in Markdown umwandelt und dabei die kostenlose Llama 3.2 Vision-Schnittstelle verwendet
Llama OCR ist eine OCR-Bibliothek (Optical Character Recognition), die auf Llama 3.2 Vision basiert und Dokumente in das Markdown-Format konvertiert. Die Bibliothek wurde von Nutlope entwickelt und verwendet die kostenlose Llama 3.2-Schnittstelle, die von Together AI für...
4.4 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Easydict
Easydict ist eine einfache und elegante Wörterbuch-Übersetzungs-App, die für macOS-Nutzer entwickelt wurde. Mit Unterstützung für mehrere Übersetzungsdienste und Offline-OCR-Erkennung, macht es die Suche nach Wörtern oder Text zu übersetzen einfach und elegant.Easydict funktioniert sofort und unterstützt Eingabe-Übersetzung, Schlaganfall-Übersetzung und Screenshot-Übersetzung für eine bequeme mehrsprachige Übersetzung Erfahrung. ...
4.8 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
Datalab: spezielles KI-Modell für OCR-Erkennung, PDF zu Markdown (Open Source/API)
Datalab bietet eine Reihe von fortschrittlichen KI-Modellen mit Schwerpunkt auf OCR, Layout-Analyse, PDF zu Markdown und mehr. Diese Modelle sind nicht nur leistungsstark, sondern auch einfach zu bedienen und quelloffen. Die Marker-Modelle auf der Plattform können PDF schnell und präzise in Markdown konvertieren, einschließlich Tabellen und Formeln...
5.4 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen
TTime
TTime, ein auf GitHub veröffentlichtes Projekt von InkTimeRecord, ist eine einfache und effiziente Übersetzungssoftware. TTime ist eine einfache und effiziente Übersetzungssoftware, die vor allem Eingabe-, Screenshot-, Strich- und Hoverball-Übersetzungsfunktionen bietet und mehrere Übersetzungsquellen und Texterkennungsdienste unterstützt, so dass Benutzer schnell Sprachkonvertierung und Texterkennung durchführen können. Darüber hinaus hat TTime auch...
3.9 Kdurch (wie in "durchgehender Zug")0Gelobt
0Lesezeichen

AI Professional Tools

Schnellabfragestation AI-Tool