Liste der unterstützten Dateitypen
- BürodokumentPDF/Word/Excel/PPT (vollständige Dokumentstruktur erforderlich)
- BilddateiJPG/PNG usw. (basiert auf OCR-Tools)
- Audiodatei (Computer)MP3/WAV, etc. (Spracherkennungsdienst erforderlich)
- Inhalt der SeiteHTML/URL (abhängig von der Webverbindung)
Beschreibung der besonderen Anforderungen
| Art des Dokuments | Abhängigkeiten | caveat |
|---|---|---|
| Bildmaterial | Tesseract OCR | Empfohlene Auflösung 300dpi oder höher |
| Tonfrequenz | Spracherkennungs-API | Sie müssen den API-Schlüssel konfigurieren |
| Web-Seite | Netzanschluss | Komplexe Seiten können Anpassungen des Selektors erfordern |
| pdf-lib | Verschlüsselte Dateien müssen entschlüsselt werden |
Erweiterte Unterstützung
durch Ändern dist/index.js Konfigurationsdatei, um Unterstützung für neue Formate hinzuzufügen. Fügen Sie zum Beispiel ein EPUB-Ebook-Parsing-Modul hinzu oder integrieren Sie einen benutzerdefinierten Dokumentenparser.
Diese Antwort stammt aus dem ArtikelMarkdownify MCP Server: Konvertiert verschiedene Inhalte in das Markdown-Format auf der Grundlage des MCP-Protokolls.Die































