Software malleability allows applications to be easily changed, configured, and adapted even after deployment. While prior work has explored configurable systems, adaptive recommender systems, and malleable GUIs, these approaches are often tailored to specific software and lack generalizability. In this work, we envision per-user malleable mobile applications, where end-users can specify requirements that are automatically implemented via LLM-based code generation. However, realizing this vision requires overcoming the key challenge of designing automated test generation that can reliably verify both the presence and correctness of user-specified functionalities. We propose \tool, a user-requirement-driven GUI test generation framework that incrementally navigates the UI, triggers desired functionalities, and constructs LLM-guided oracles to validate correctness. We build a benchmark spanning six popular mobile applications with both correct and faulty user-requested functionalities, demonstrating that \tool effectively validates per-user features and is practical for real-world deployment. Our work highlights the feasibility of shifting mobile app development from a product-manager-driven to an end-user-driven paradigm.


翻译:软件可延展性允许应用程序即使在部署后也能轻松更改、配置和适配。虽然先前的工作已探索了可配置系统、自适应推荐系统和可延展图形用户界面,但这些方法通常针对特定软件量身定制,缺乏通用性。在本工作中,我们构想出面向每位用户的可延展移动应用,其中最终用户能够指定需求,这些需求将通过基于大语言模型的代码生成自动实现。然而,实现这一愿景需要克服关键挑战:设计能够可靠验证用户指定功能存在性及其正确性的自动化测试生成。我们提出 \tool 框架,这是一种用户需求驱动的GUI测试生成框架,它增量式地导航用户界面、触发所需功能,并构建大语言模型引导的预测器以验证正确性。我们构建了一个涵盖六款流行移动应用的基准测试集,其中包含正确及有缺陷的用户请求功能,结果表明 \tool 能有效验证面向每位用户的功能特性,并具备实际部署的实用性。我们的工作凸显了将移动应用开发从产品经理驱动范式转向最终用户驱动范式的可行性。

0
下载
关闭预览

相关内容

为小型低能耗的手持设备开发的应用软件。
通用智能体评估的逻辑架构
专知会员服务
22+阅读 · 2月28日
智能体适应
专知会员服务
27+阅读 · 2025年12月11日
《软件定义网络元素与机器代码的形式化验证》
专知会员服务
14+阅读 · 2025年11月18日
用于自动驾驶系统测试的生成式人工智能:综述
专知会员服务
17+阅读 · 2025年8月28日
专知会员服务
98+阅读 · 2021年1月24日
【KDD2020-Tutorial】自动推荐系统,Automated Recommendation System
【资源】领域自适应相关论文、代码分享
专知
32+阅读 · 2019年10月12日
爱奇艺基于AI的移动端自动化测试框架的设计
前端之巅
18+阅读 · 2019年2月27日
如何将知识图谱特征学习应用到推荐系统?
人工智能头条
12+阅读 · 2018年6月10日
《软件方法》1-8章全部自测题更新内容
UMLChina
11+阅读 · 2018年3月26日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
1+阅读 · 今天15:03
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
0+阅读 · 今天14:31
学习数据的几何:形状空间分析数学综述
专知会员服务
8+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
10+阅读 · 6月17日
相关VIP内容
通用智能体评估的逻辑架构
专知会员服务
22+阅读 · 2月28日
智能体适应
专知会员服务
27+阅读 · 2025年12月11日
《软件定义网络元素与机器代码的形式化验证》
专知会员服务
14+阅读 · 2025年11月18日
用于自动驾驶系统测试的生成式人工智能:综述
专知会员服务
17+阅读 · 2025年8月28日
专知会员服务
98+阅读 · 2021年1月24日
【KDD2020-Tutorial】自动推荐系统,Automated Recommendation System
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员