支持的文件类型列表
- 办公文档:PDF/Word/Excel/PPT(需文件结构完整)
- image file:JPG/PNG 等(依赖 OCR 工具)
- audio file (computer):MP3/WAV 等(需配置语音识别服务)
- Page content:HTML/URL(依赖网络连接)
特殊要求说明
Document type | 依赖项 | caveat |
---|---|---|
imagery | Tesseract OCR | 建议 300dpi 以上分辨率 |
sound frequency | 语音识别API | 需配置 API 密钥 |
web page | network connection | 复杂网页可能需要调整选择器 |
pdf-lib | 加密文件需要解密 |
Extended Support
by modifying dist/index.js
配置文件,可以添加对新格式的支持。例如增加 EPUB 电子书解析模块,或集成自定义的文档解析器。
This answer comes from the articleMarkdownify MCP Server: Converts various content to Markdown format based on the MCP protocol.The