Formatos de arquivo suportados
AiryLark 具有专业的文档解析引擎,可智能识别以下格式:
- 结构化文档:PDF(保留原始排版)、Word(.doc/.docx)
- 纯文本类:TXT(UTF-8编码)、Markdown(支持标题/列表等语法)
- 网页内容:通过URL直接抓取HTML正文(自动过滤广告等干扰元素)
大文档处理能力
通过技术创新实现了高效处理:
- 流式处理技术:采用分块加载机制,实时显示翻译进度条,避免浏览器卡死
- memória contextual:通过滑动窗口算法保持超过10页文档的语义连贯性
- Otimização de recursos:默认启用缓存机制,重复翻译相同内容时直接调用历史结果
desempenho:实测处理100页PDF约需3-5分钟(取决于API响应速度),内存占用控制在500MB以内。但建议超过50MB的文件优先使用本地部署方案,网络传输可能成为在线版的瓶颈。
Essa resposta foi extraída do artigoAiryLark: ferramenta de código aberto para tradução inteligente de documentos em vários formatosO