Unterstützte Dateiformate
AiryLark 具有专业的文档解析引擎,可智能识别以下格式:
- 结构化文档:PDF(保留原始排版)、Word(.doc/.docx)
- 纯文本类:TXT(UTF-8编码)、Markdown(支持标题/列表等语法)
- 网页内容:通过URL直接抓取HTML正文(自动过滤广告等干扰元素)
大文档处理能力
通过技术创新实现了高效处理:
- 流式处理技术:采用分块加载机制,实时显示翻译进度条,避免浏览器卡死
- kontextuelle Erinnerung:通过滑动窗口算法保持超过10页文档的语义连贯性
- Optimierung der Ressourcen:默认启用缓存机制,重复翻译相同内容时直接调用历史结果
Leistung:实测处理100页PDF约需3-5分钟(取决于API响应速度),内存占用控制在500MB以内。但建议超过50MB的文件优先使用本地部署方案,网络传输可能成为在线版的瓶颈。
Diese Antwort stammt aus dem ArtikelAiryLark: Open-Source-Tool für die intelligente Übersetzung von Dokumenten in mehreren FormatenDie