跨格式论文处理一体化方案
科研人员常需同时处理arXiv预印本、Sci-Hub付费论文、本地PDF等多种文献格式,传统方式需要切换不同工具。OneFileLLM提供统一解决方案:
- arXiv直连:输入arxiv.org/abs/格式URL,自动下载解析(示例:
https://arxiv.org/abs/2401.14295
) - Sci-Hub集成:支持DOI/PMID输入(如
10.1053/j.ajkd.2017.08.002
),自动通过Sci-Hub获取全文 - 本地文件支持:直接拖放PDF文件到命令行或网页界面,自动OCR识别(依赖系统PDF库)
关键优势:
• 输出统一XML格式便于LLM解析:<source type="arxiv_paper">...</source>
• 自动合并多个论文到单个文件
• 保留原始文献元数据
注意:需确保网络通畅,Sci-Hub域名可能需根据地区调整。
This answer comes from the articleOneFileLLM: Integrating Multiple Data Sources into a Single Text FileThe