LLM-based assistants have been widely popularised after the release of ChatGPT. Concerns have been raised about their misuse in academia, given the difficulty of distinguishing between human-written and generated text. To combat this, automated techniques have been developed and shown to be effective, to some extent. However, prior work suggests that these methods often falsely flag essays from non-native speakers as generated, due to their low perplexity extracted from an LLM, which is supposedly a key feature of the detectors. We revisit these statements two years later, specifically in the Czech language setting. We show that the perplexity of texts from non-native speakers of Czech is not lower than that of native speakers. We further examine detectors from three separate families and find no systematic bias against non-native speakers. Finally, we demonstrate that contemporary detectors operate effectively without relying on perplexity.


翻译:随着ChatGPT的发布,基于LLM的辅助工具已得到广泛普及。鉴于区分人类撰写文本与生成文本的困难,人们对其在学术领域的滥用提出了担忧。为应对此问题,自动化检测技术已被开发出来,并在一定程度上被证明是有效。然而,先前研究表明,这些方法常因非母语者文章从LLM中提取的低困惑度而将其误判为生成文本,而困惑度被认为是检测器的关键特征。两年后,我们以捷克语为具体场景重新审视这些论断。我们证明,捷克语非母语者文本的困惑度并不低于母语者。我们进一步检验了来自三个不同家族的检测器,发现其并不存在针对非母语者的系统性偏见。最后,我们论证了当代检测器无需依赖困惑度即可有效运行。

0
下载
关闭预览

相关内容

《利用 ChatGPT 实现高效事实核查》
专知会员服务
47+阅读 · 2023年10月25日
字节跳动李航:对语言大模型的若干观察和思考
专知会员服务
66+阅读 · 2023年10月15日
Nat. Med. | 医学中的大型语言模型
专知会员服务
58+阅读 · 2023年9月19日
如何检测ChatGPT?TUM最新《检测ChatGPT生成文本现状》综述
中文对比英文自然语言处理NLP的区别综述
AINLP
18+阅读 · 2019年3月20日
语音关键词检测方法综述【附PPT与视频资料】
人工智能前沿讲习班
10+阅读 · 2019年2月2日
NLG ≠ 机器写作 | 专家专栏
量子位
13+阅读 · 2018年9月10日
干货|当深度学习遇见自动文本摘要,seq2seq+attention
机器学习算法与Python学习
10+阅读 · 2018年5月28日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
VIP会员
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员