支持的文件类型列表
- 办公文档:PDF/Word/Excel/PPT(需文件结构完整)
- arquivo de imagem:JPG/PNG 等(依赖 OCR 工具)
- arquivo de áudio (computador):MP3/WAV 等(需配置语音识别服务)
- 网页内容:HTML/URL(依赖网络连接)
特殊要求说明
Tipo de documento | 依赖项 | advertência |
---|---|---|
imagens | Tesseract OCR | 建议 300dpi 以上分辨率 |
frequência sonora | 语音识别API | 需配置 API 密钥 |
página da web | conexão de rede | 复杂网页可能需要调整选择器 |
pdf-lib | 加密文件需要解密 |
Suporte estendido
modificando dist/index.js
配置文件,可以添加对新格式的支持。例如增加 EPUB 电子书解析模块,或集成自定义的文档解析器。
Essa resposta foi extraída do artigoMarkdownify MCP Server: converte vários conteúdos no formato Markdown com base no protocolo MCP.O