首页 > 资讯 > 快讯

清华大学智能产业研究院发布AutoDroid-V2,大幅提升移动设备自然语言控制自动化

2025/01/02 16:37      Donews   


  清华大学智能产业研究院(AIR)于2024年12月24日发布了一篇论文,介绍推出AutoDroid-V2 AI模型。该模型在移动设备上利用小型语言模型(SLM),显著提升了自然语言控制的自动化程度。

  AutoDroid-V2采用基于脚本的方法,通过设备端的小型语言模型高效执行用户指令,相比依赖云端大型语言模型(LLM)的传统方法,在效率、隐私和安全性方面均有显著优势。该系统生成多步骤脚本一次性执行多个GUI操作,大幅减少了查询频率和资源消耗,有效保护了用户隐私和数据安全,并降低了服务器端成本。

  基准测试结果显示,在23个移动应用上测试226项任务时,AutoDroid-V2的任务完成率比AutoDroid、SeeClick、CogAgent和Mind2Web等基线提高了10.5%-51.7%。在资源消耗方面,输入和输出token消耗分别减少至原来的43.5分之一和5.8分之一,LLM推理延迟降低至5.7~13.4分之一。

  此外,跨LLM测试中,AutoDroid-V2在Llama3.2-3B、Qwen2.5-7B和Llama3.1-8B上的成功率为44.6%-54.4%,反向冗余比为90.5%-93.0%。

  更多详情可参考论文《AutoDroid-V2: Boosting SLM-based GUI Agents via Code Generation》。

  榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。

相关阅读

    无相关信息