AutoForm: KI-Tool, das Daten aus beliebigen Dokumenten extrahiert und Webformulare automatisch ausfüllt
AutoForm ist ein Tool, das die Technologie der künstlichen Intelligenz nutzt, um Benutzer von sich wiederholenden Kopier- und Einfügeaufgaben zu befreien. Seine Kernfunktion besteht darin, als "KI-Dateneingabe-Agent" zu fungieren, der unstrukturierte Dateien in verschiedenen Formaten wie PDF-Dokumente, Tabellenkalkulationen, E-Mails, Webdateien und...
OCRmyPDF: gescanntes PDF in durchsuchbaren Text des Open-Source-Tools
OCRmyPDF ist ein Open-Source-Befehlszeilen-Tool zum Hinzufügen einer OCR-Textebene (Optical Character Recognition) zu gescannten PDF-Dateien, wodurch diese in durchsuchbare, reproduzierbare Dokumente verwandelt werden. Es basiert auf der Python-Entwicklung, verwendet die Tesseract OCR-Engine, kann den Text im Bild genau identifizieren und in die PDF-Datei einbetten...
Docstrange: ein Tool zum Extrahieren von Daten aus Dokumenten und Bildern und deren Konvertierung in verschiedene Formate
Docstrange ist ein Open-Source-Dokumentenverarbeitungswerkzeug, das sich auf die Extraktion von Daten aus Dokumenten und Bildern in verschiedenen Formaten und deren Konvertierung in Formate wie Markdown, JSON, CSV oder HTML konzentriert. Es verwendet künstliche Intelligenz und fortschrittliche OCR-Technologie, Unterstützung für die Verarbeitung von PDF, Word-Dokumenten, Exce...
LangExtract: Open-Source-Tool zur Extraktion strukturierter Daten aus Text
LangExtract ist eine von Google entwickelte Open-Source-Python-Bibliothek, die sich auf die Extraktion strukturierter Daten aus unstrukturiertem Text konzentriert. Sie verwendet große Sprachmodelle (LLMs) wie die Google Gemini-Familie, kombiniert mit einer genauen Lokalisierung des Ausgangstextes und interaktiven Visualisierungsfunktionen, um den Nutzern zu helfen, komplexe Texte schnell zu ...
Chat4Data: ein KI-Tool zur Extraktion von Webdaten durch natürliche Sprache
Chat4Data ist eine KI-basierte Chrome-Erweiterung, die sich auf die Vereinfachung der Datenextraktion auf Webseiten konzentriert. Sie macht es den Nutzern leicht, auf strukturierte Daten auf Webseiten durch natürlichsprachliche Dialoge zuzugreifen, ohne Code zu schreiben. Benutzer müssen nur die erforderlichen Daten in einfacher Sprache beschreiben, wie z. B. Produktname, Preis oder...
ytt-mcp: Server-Tool zum Abrufen und Verarbeiten von Untertiteln für YouTube-Videos
ytt-mcp ist ein quelloffenes MCP (Model Context Protocol) Server-Tool, das speziell dafür entwickelt wurde, Untertitel aus YouTube-Videos zu übernehmen und zu verarbeiten. Es wurde vom cottongeeks-Team entwickelt und auf GitHub gehostet. Es soll Benutzern helfen, Videountertitel schnell mit einfachen Befehlen oder KI-Tools zu extrahieren und unterstützt weitere...
WaterCrawl: Umwandlung von Webinhalten in Daten, die für große Modelle verwendet werden können
WaterCrawl ist ein leistungsfähiges Open-Source-Web-Crawler-Tool, das Benutzern helfen soll, Daten aus Webseiten zu extrahieren und sie in ein Datenformat umzuwandeln, das für die Verarbeitung von Large Language Modelling (LLM) geeignet ist. Es basiert auf Python-Entwicklung, kombiniert mit Django, Scrapy und Celery-Technologie, unterstützt effizientes Web-Crawling und Daten...
Delphin
Dolphin wurde von ByteDance entwickelt und ist ein Open-Source-Werkzeug zur Analyse von Dokumentenbildern, das sich auf die Verarbeitung komplexer Dokumentenbilder konzentriert, wie z. B. Text, Tabellen, Formeln und Bilder, die in gescannten oder PDF-Dateien enthalten sind. Es verwendet den Ansatz der "ersten Analyse nach der Analyse" durch einen zweistufigen Prozess, um ein effizientes Parsing zu erreichen: Zuerst wird der Text analysiert ...
OneFileLLM: Integration mehrerer Datenquellen in eine einzige Textdatei
OneFileLLM ist ein Open-Source-Befehlszeilen-Tool, das entwickelt wurde, um mehrere Datenquellen in einer einzigen Textdatei für die einfache Eingabe von Large Language Models (LLMs) zu konsolidieren. Es unterstützt die Verarbeitung von GitHub-Repositories, ArXiv-Papieren, YouTube-Videotranskriptionen, Web-Inhalten, Sci-Hub-Papieren und lokalen Dateien und generiert automatisch die Struktur...
Chatlog: Open-Source-Tool zum Extrahieren und Abfragen von WeChat-Chat-Protokollen
Chatlog ist ein Open-Source-Tool, das sich auf die Extraktion und Abfrage von Chat-Protokollen aus der lokalen Datenbank von WeChat konzentriert. Es unterstützt die WeChat-Versionen 3.x und 4.0 und deckt Windows- und macOS-Systeme ab. Benutzer können über die Befehlszeile, Terminal-Schnittstelle oder HTTP-API arbeiten, um Chat-Protokolle, Kontakte, Gruppenchats und...
DevDocs: ein MCP-Dienst zum schnellen Durchsuchen und Organisieren technischer Dokumentation
DevDocs ist ein völlig kostenloses und quelloffenes Tool, das vom CyberAGI-Team entwickelt und auf GitHub gehostet wird. Es wurde für Programmierer und Softwareentwickler entwickelt, um von der URL eines technischen Dokuments auszugehen, automatisch die relevanten Seiten zu crawlen und sie in prägnanten Markdown- oder JSON-Dateien zu organisieren. Es hat einen eingebauten MCP ...
Mehrere Dateien kostenlos in das Markdown-Format konvertieren, basierend auf Workers AI
serverless-markdown-convertor ist ein kostenloses Open-Source-Tool, das auf Cloudflare Worker und Workers AI basiert und eine breite Palette von Dateien in das Markdown-Format konvertiert. Es unterstützt PDF, Bilder, Office-Dokumente ...
GPT-Crawler: Automatisches Crawlen von Website-Inhalten zur Erzeugung von Wissensdatenbank-Dokumenten
GPT-Crawler ist ein Open-Source-Tool, das vom BuilderIO-Team entwickelt und auf GitHub gehostet wird. Es durchsucht Seiteninhalte durch Eingabe einer oder mehrerer Website-URLs und erzeugt eine strukturierte Wissensdatei (output.json), die zur Erstellung eines benutzerdefinierten GPT- oder KI-Assistenten verwendet werden kann. Benutzer...
pure.md: Fügen Sie "pure.md/" vor der URL ein, um sauberen Text zu extrahieren.
pure.md ist ein Tool für KI-Agenten und Entwickler, das sich auf die schnelle Umwandlung von Webinhalten oder Dateien in das Markdown-Format konzentriert. Es umgeht Anti-Crawler-Einschränkungen durch Proxy-Dienste, extrahiert die Kerndaten einer Webseite und gibt eine saubere Markdown-Datei aus. Egal, ob es sich um eine dynamische Webseite, eine PDF-Datei oder eine soziale...
Cloudsquid: Dokumente hochladen und Anforderungen für die intelligente Extraktion von strukturierten Daten beschreiben
Cloudsquid ist ein 2023 in Berlin gegründetes Unternehmen, das sich auf die Vereinfachung der Dokumentenverarbeitung mit künstlicher Intelligenz konzentriert. Das Kernprodukt ist eine Online-Plattform zur Datenextraktion, die es Nutzern ermöglicht, PDFs, Bilder, Audio, Video usw. hochzuladen und einfach die zu extrahierenden Daten anzugeben, z. B. "Finde den Namen und die...
PDF Craft: Gescannte PDF-Dokumente in Markdown umwandeln Open-Source-Tools
PDF Craft ist ein Open-Source-Tool, mit dem PDFs von Büchern gescannt und in das Markdown-Format konvertiert werden können. Es wird von oomol-lab entwickelt und auf GitHub für Benutzer gehostet, die ihre eBooks organisieren möchten. Das Tool läuft über ein lokales KI-Modell und benötigt keine Internetverbindung, was die Privatsphäre schützt und die Bedienung erleichtert. ....
Supametas.AI: Extraktion unstrukturierter Daten in hochverfügbare LLM-Daten
Supametas.AI ist eine Datenverarbeitungsplattform, die sich darauf spezialisiert hat, das Durcheinander von Webseiten, Dokumenten, Audio und Video in strukturierte Daten umzuwandeln, die KI nutzen kann. Sie unterstützt das Sammeln von Daten aus verschiedenen Quellen, einschließlich Weblinks, APIs, lokalen Dateien usw., und exportiert sie dann in das JSON- oder Markdown-Format. Die Plattform erfordert keine Programmierung...
MarkPDFDown: Konvertierung von PDF in Markdown basierend auf einem multimodalen Modell
MarkPDFDown ist ein Open-Source-Werkzeug. Es verwendet das multimodale große Sprachmodell, um PDF-Dateien in das Markdown-Format zu konvertieren. Entwickelt von GitHub-Benutzer jorben, hat dieses Tool ein einfaches Ziel: PDF-Dokumente einfacher zu bearbeiten und zu teilen. Es erkennt Überschriften, Listen,...
SmolDocling: ein visuelles Sprachmodell für die effiziente Verarbeitung von Dokumenten in einem kleinen Volumen
SmolDocling ist ein Visual Language Model (VLM), das vom ds4sd-Team in Zusammenarbeit mit IBM entwickelt wurde. Es basiert auf SmolVLM-256M und wird auf der Hugging Face-Plattform gehostet. SmolDocling ist das kleinste VLM der Welt mit nur 256M Parametern, und seine Kernfunktion ist...
zurück zum Anfang