OmniParser V2.0的功能升级
最新发布的OmniParser V2.0在原有版本的基础上进行了重大升级,特别是在图标检测和交互元素预测方面取得了突破性进展。新版本采用了改进的计算机视觉算法,能够更精准地识别界面中的各种图标,并准确预测其功能和交互属性。
V2.0版本的主要改进包括:
- 引入新的Florence模型用于图标描述
- 改进的神经网络架构提升了检测精度
- 交互预测成功率提高至95%以上
- 处理速度相比前代提升40%
这些性能提升使其在自动化测试、辅助功能开发等场景中的表现更加出色。微软官方测试数据显示,V2.0在复杂界面的解析时间平均减少到2秒以内。
Essa resposta foi extraída do artigoOmniParser: capturas de tela da interface do usuário analisadas em elementos estruturados para facilitar a compreensão e a manipulação de modelos grandesO