Grey literature is essential to software engineering research as it captures practices and decisions that rarely appear in academic venues. However, collecting and assessing it at scale remains difficult because of their heterogeneous sources, formats, and APIs that impede reproducible, large-scale synthesis. To address this issue, we present GLiSE, a prompt-driven tool that turns a research topic prompt into platform-specific queries, gathers results from common software-engineering web sources (GitHub, Stack Overflow) and Google Search, and uses embedding-based semantic classifiers to filter and rank results according to their relevance. GLiSE is designed for reproducibility with all settings being configuration-based, and every generated query being accessible. In this paper, (i) we present the GLiSE tool, (ii) provide a curated dataset of software engineering grey-literature search results classified by semantic relevance to their originating search intent, and (iii) conduct an empirical study on the usability of our tool.


翻译:灰色文献对于软件工程研究至关重要,因为它记录了学术渠道中鲜少出现的实践与决策。然而,由于其来源、格式和API的异构性阻碍了可复现的大规模综合研究,大规模收集与评估灰色文献仍然困难重重。为解决这一问题,我们提出了GLiSE——一种基于提示驱动的工具,能够将研究主题提示转化为特定平台查询,从常见的软件工程网络资源(GitHub、Stack Overflow)及谷歌搜索中收集结果,并利用基于嵌入的语义分类器根据相关性对结果进行过滤与排序。GLiSE以实现可复现性为设计目标,所有设置均基于配置文件,且每个生成的查询均可追溯。本文中,(i)我们介绍了GLiSE工具;(ii)提供了一个经人工整理的软件工程灰色文献搜索结果数据集,其中结果已按其与原始搜索意图的语义相关性进行分类;(iii)对我们的工具可用性进行了实证研究。

0
下载
关闭预览

相关内容

软件(中国大陆及香港用语,台湾作软体,英文:Software)是一系列按照特定顺序组织的计算机数据和指令的集合。一般来讲软件被划分为编程语言、系统软件、应用软件和介于这两者之间的中间件。软件就是程序加文档的集合体。
自动化提示工程综述:一种优化视角
专知会员服务
28+阅读 · 2025年2月18日
【AAAI2025】SAIL:面向样本的上下文学习用于文档信息提取
专知会员服务
21+阅读 · 2024年12月24日
【翻译技术速递】测评:免费的术语抽取工具
翻译技术沙龙
139+阅读 · 2019年11月2日
Jiagu:中文深度学习自然语言处理工具
AINLP
90+阅读 · 2019年2月20日
计算机视觉方向简介 | 用深度学习进行表格提取
计算机视觉life
21+阅读 · 2019年2月19日
推荐系统资源(文献、工具、框架)整理
专知
18+阅读 · 2019年2月4日
TextInfoExp:自然语言处理相关实验(基于sougou数据集)
全球人工智能
12+阅读 · 2017年11月12日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月5日
VIP会员
相关VIP内容
自动化提示工程综述:一种优化视角
专知会员服务
28+阅读 · 2025年2月18日
【AAAI2025】SAIL:面向样本的上下文学习用于文档信息提取
专知会员服务
21+阅读 · 2024年12月24日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员