Large language models (LLMs) have rapidly emerged in civil and environmental engineering (CEE) research, education, and practice as tools for project ideation, execution, and communication. However, it is unknown how prevalent LLM adoption is across CEE scholarship and whether it measurably alters research prose. Inspired by recent analyses of biomedical research, this study uses a vocabulary-based frequency-shift methodology to detect linguistic signals of LLM-assisted writing in a large corpus of CEE literature. A total of 149,452 abstracts published by the American Society of Civil Engineers from 2000 through 2025 are analyzed to quantify deviations from long-term vocabulary trends. Prior to the introduction of LLMs in 2022, CEE publications exhibit long-term trends toward longer abstracts and sentences, greater use of segmenting punctuation, higher required reading levels, and a shift toward active, first-person verb constructions. Beginning around 2023, however, the frequencies of many stylistic marker words (e.g., enhance) sharply depart from historical trajectories, accompanied by deviations in multiple semantic properties. Abstracts classified as likely LLM-assisted exhibit increased lexical diversity, comma use, and complexity, with reduced passive voice and hedging language, producing prose that is more segmented, complex, and confident. The AI contribution of this study lies in the use of natural language processing to identify population-level linguistic signals of LLM-assisted text, applied to quantify the prevalence of LLM use and its influence on the vocabulary, structure, and tone of engineering scholarly writing. Together, these findings provide the first large-scale, data-driven assessment of how LLMs are beginning to reshape scholarly communication in CEE.


翻译:大型语言模型(LLMs)已迅速成为土木与环境工程(CEE)研究、教育及实践中用于项目构思、执行和沟通的工具。然而,LLMs在CEE学术领域的普及程度及其是否可测量地改变了研究写作风格尚不明确。受近期生物医学研究分析的启发,本研究采用基于词汇的频率偏移方法,在CEE大规模文献语料库中检测LLM辅助写作的语言信号。研究分析了美国土木工程师学会2000年至2025年间发表的149,452篇摘要,以量化与长期词汇趋势的偏差。在2022年LLM出现之前,CEE出版物呈现出摘要和句子变长、分隔标点使用增加、所需阅读水平提高以及向主动第一人称动词结构转变的长期趋势。然而,自2023年左右起,许多风格标记词(如“增强”)的频率与历史轨迹出现显著偏离,同时多个语义属性也发生偏移。被归类为可能由LLM辅助的摘要表现出词汇多样性、逗号使用和复杂性的提升,被动语态和模糊表达减少,从而产生更加分段化、复杂且自信的写作风格。本研究的AI贡献在于利用自然语言处理识别LLM辅助文本的群体级语言信号,并据此量化LLM使用的普及程度及其对工程学术写作词汇、结构和语气的影响。综合而言,这些发现首次提供了大规模、数据驱动的评估,揭示了LLMs如何开始重塑CEE领域的学术交流。

0
下载
关闭预览

相关内容

评估大语言模型在科学发现中的作用
专知会员服务
19+阅读 · 2025年12月19日
面向统计学家的大型语言模型概述
专知会员服务
32+阅读 · 2025年3月16日
LLM4SR:关于大规模语言模型在科学研究中的应用综述
专知会员服务
42+阅读 · 2025年1月9日
大型语言模型在预测和异常检测中的应用综述
专知会员服务
70+阅读 · 2024年2月19日
天大最新《大型语言模型评估》全面综述,111页pdf
专知会员服务
88+阅读 · 2023年10月31日
自然语言处理中的语言模型预训练方法
PaperWeekly
14+阅读 · 2018年10月21日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Arxiv
26+阅读 · 2024年2月9日
Arxiv
21+阅读 · 2023年7月12日
Arxiv
12+阅读 · 2023年5月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员