专业译者能否识别机器生成的文本？ (Can professional translators identify machine-generated text?) - 专知论文

会员服务 ·

0

识别 · AI · 合成 · 分析 · GPT-4 ·

Can professional translators identify machine-generated text?

翻译：专业译者能否识别机器生成的文本？

Michael Farrell

from arxiv, 10 pages

This study investigates whether professional translators can reliably identify short stories generated in Italian by artificial intelligence (AI) without prior specialized training. Sixty-nine translators took part in an in-person experiment, where they assessed three anonymized short stories - two written by ChatGPT-4o and one by a human author. For each story, participants rated the likelihood of AI authorship and provided justifications for their choices. While average results were inconclusive, a statistically significant subset (16.2%) successfully distinguished the synthetic texts from the human text, suggesting that their judgements were informed by analytical skill rather than chance. However, a nearly equal number misclassified the texts in the opposite direction, often relying on subjective impressions rather than objective markers, possibly reflecting a reader preference for AI-generated texts. Low burstiness and narrative contradiction emerged as the most reliable indicators of synthetic authorship, with unexpected calques, semantic loans and syntactic transfer from English also reported. In contrast, features such as grammatical accuracy and emotional tone frequently led to misclassification. These findings raise questions about the role and scope of synthetic-text editing in professional contexts.

翻译：本研究探讨专业译者在未经专门训练的情况下，能否可靠地识别由人工智能（AI）生成的意大利语短篇小说。69名译者参与了一项现场实验，评估了三篇匿名短篇小说——其中两篇由ChatGPT-4o生成，一篇由人类作者创作。针对每篇故事，参与者评估了AI作者身份的可能性并提供了判断依据。虽然平均结果尚无定论，但一个具有统计学意义的子集（16.2%）成功区分了合成文本与人类文本，表明其判断基于分析能力而非偶然。然而，几乎同等数量的译者做出了相反方向的错误分类，往往依赖主观印象而非客观标记，这可能反映了读者对AI生成文本的偏好。低突发性和叙事矛盾成为合成作者身份最可靠的指标，同时报告了来自英语的意外仿译、语义借用和句法迁移现象。相比之下，语法准确性和情感基调等特征常导致误判。这些发现对专业语境中合成文本编辑的作用与范围提出了新的思考。

0

相关内容

【新书】聊天机器人和文本生成

【新书】聊天机器人和文本生成

专知会员服务

32+阅读 · 2024年8月8日

GPT文本如何检测？《检测AI生成文本：影响当前方法检测能力的因素》最新综述

GPT文本如何检测？《检测AI生成文本：影响当前方法检测能力的因素》最新综述

专知会员服务

24+阅读 · 2024年7月3日

《预测大语言模型生成的代码转换文本的真实性》2023最新59页论文

《预测大语言模型生成的代码转换文本的真实性》2023最新59页论文

专知会员服务

28+阅读 · 2023年12月1日

如何检测ChatGPT？TUM最新《检测ChatGPT生成文本现状》综述

如何检测ChatGPT？TUM最新《检测ChatGPT生成文本现状》综述

专知会员服务

41+阅读 · 2023年9月17日

控制大型语言模型: 从我们不完全理解的模型中生成(有用)文本，114页pdf

控制大型语言模型: 从我们不完全理解的模型中生成(有用)文本，114页pdf

专知会员服务

64+阅读 · 2023年6月5日

未来GPT-5一统AIGC任务？韩国庆熙大学等最新《生成式人工智能AIGC》综述，56页pdf全面阐述AIGC的文本图像生成技术

未来GPT-5一统AIGC任务？韩国庆熙大学等最新《生成式人工智能AIGC》综述，56页pdf全面阐述AIGC的文本图像生成技术

专知会员服务

150+阅读 · 2023年3月22日

【ChatGPT系列报告】斯坦福HAT《生成式人工智能》报告，李飞飞、Percy Liang等大牛评述GAI

【ChatGPT系列报告】斯坦福HAT《生成式人工智能》报告，李飞飞、Percy Liang等大牛评述GAI

专知会员服务

134+阅读 · 2023年3月15日

《将机器中的语言与大脑中的语言联系起来》150页博士论文，卡耐基梅隆大学

《将机器中的语言与大脑中的语言联系起来》150页博士论文，卡耐基梅隆大学

专知会员服务

48+阅读 · 2022年5月12日

最新【关于机器翻译评测研究的综述性报告 An Overview on Machine Translation Evaluation】Lifeng Han

最新【关于机器翻译评测研究的综述性报告 An Overview on Machine Translation Evaluation】Lifeng Han

专知会员服务

17+阅读 · 2022年2月25日

【剑桥大学】神经机器翻译综述论文，Neural Machine Translation: A Review，附88页pdf

【剑桥大学】神经机器翻译综述论文，Neural Machine Translation: A Review，附88页pdf

专知会员服务

37+阅读 · 2019年12月4日

如何向ChatGPT问问题？这本手册《提问的艺术—让ChatGPT给出高质量答案》，提示工程技术全面指南，52页pdf

如何向ChatGPT问问题？这本手册《提问的艺术—让ChatGPT给出高质量答案》，提示工程技术全面指南，52页pdf

专知

27+阅读 · 2023年4月13日

CCCF专栏 | 朱晨光：机器阅读理解：如何让计算机读懂文章

CCCF专栏 | 朱晨光：机器阅读理解：如何让计算机读懂文章

中国计算机学会

24+阅读 · 2019年2月15日

书单 | 系统了解智能问答和机器翻译，从这两本书开始（文末有福利）

书单 | 系统了解智能问答和机器翻译，从这两本书开始（文末有福利）

微软研究院AI头条

24+阅读 · 2019年1月22日

机器翻译学术论文写作方法和技巧

机器翻译学术论文写作方法和技巧

清华大学研究生教育

11+阅读 · 2018年12月23日

NLG ≠ 机器写作 | 专家专栏

NLG ≠ 机器写作 | 专家专栏

量子位

13+阅读 · 2018年9月10日

中文NLP用什么？中文自然语言处理的完整机器处理流程

中文NLP用什么？中文自然语言处理的完整机器处理流程

人工智能头条

61+阅读 · 2018年9月5日

实践 | 如何使用深度学习为照片自动生成文本描述？

实践 | 如何使用深度学习为照片自动生成文本描述？

七月在线实验室

10+阅读 · 2018年5月21日

Deepmind 新成果，让机器挑战更复杂阅读理解问题

Deepmind 新成果，让机器挑战更复杂阅读理解问题

AI掘金志

11+阅读 · 2018年1月3日

清华大学：刘洋——基于深度学习的机器翻译

清华大学：刘洋——基于深度学习的机器翻译

人工智能学家

12+阅读 · 2017年11月13日

【干货】神经机器翻译全流程解析，one-shot 和 zero-shot 学习成亮点

【干货】神经机器翻译全流程解析，one-shot 和 zero-shot 学习成亮点

新智元

10+阅读 · 2017年4月2日

面向大类别的空中手写中英文识别技术研究

国家自然科学基金

2+阅读 · 2017年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

词典驱动的联机手写维吾尔文单词识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

联机手写维吾尔文基础数据库及识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

脱机手写藏文字符识别研究

国家自然科学基金

0+阅读 · 2014年12月31日

可重构的环境自适应RS码软判决译码器研究

国家自然科学基金

0+阅读 · 2014年12月31日

Differentiating Between Human-Written and AI-Generated Texts Using Automatically Extracted Linguistic Features

Arxiv

0+阅读 · 2月17日

Can LLMs Automate Fact-Checking Article Writing?

Arxiv

0+阅读 · 2月10日

How University Disability Services Professionals Write Image Descriptions for HCI Figures Using Generative AI

Arxiv

0+阅读 · 2月9日

FAID: Fine-Grained AI-Generated Text Detection Using Multi-Task Auxiliary and Multi-Level Contrastive Learning

Arxiv

0+阅读 · 2月8日

From Crafting Text to Crafting Thought: Grounding AI Writing Support to Writing Center Pedagogy

Arxiv

0+阅读 · 2月3日

Agnostic Language Identification and Generation

Arxiv

0+阅读 · 1月30日

Benchmarking Machine Translation on Chinese Social Media Texts

Arxiv

0+阅读 · 1月30日

Understanding Reader Perception Shifts upon Disclosure of AI Authorship

Arxiv

0+阅读 · 1月22日

Who Owns the Text? Design Patterns for Preserving Authorship in AI-Assisted Writing

Arxiv

0+阅读 · 1月15日

Exploring the Effects of Generative AI Assistance on Writing Self-Efficacy

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

相关VIP内容

【新书】聊天机器人和文本生成

【新书】聊天机器人和文本生成

专知会员服务

32+阅读 · 2024年8月8日

GPT文本如何检测？《检测AI生成文本：影响当前方法检测能力的因素》最新综述

GPT文本如何检测？《检测AI生成文本：影响当前方法检测能力的因素》最新综述

专知会员服务

24+阅读 · 2024年7月3日

《预测大语言模型生成的代码转换文本的真实性》2023最新59页论文

《预测大语言模型生成的代码转换文本的真实性》2023最新59页论文

专知会员服务

28+阅读 · 2023年12月1日

如何检测ChatGPT？TUM最新《检测ChatGPT生成文本现状》综述

如何检测ChatGPT？TUM最新《检测ChatGPT生成文本现状》综述

专知会员服务

41+阅读 · 2023年9月17日

控制大型语言模型: 从我们不完全理解的模型中生成(有用)文本，114页pdf

控制大型语言模型: 从我们不完全理解的模型中生成(有用)文本，114页pdf

专知会员服务

64+阅读 · 2023年6月5日

未来GPT-5一统AIGC任务？韩国庆熙大学等最新《生成式人工智能AIGC》综述，56页pdf全面阐述AIGC的文本图像生成技术

未来GPT-5一统AIGC任务？韩国庆熙大学等最新《生成式人工智能AIGC》综述，56页pdf全面阐述AIGC的文本图像生成技术

专知会员服务

150+阅读 · 2023年3月22日

【ChatGPT系列报告】斯坦福HAT《生成式人工智能》报告，李飞飞、Percy Liang等大牛评述GAI

【ChatGPT系列报告】斯坦福HAT《生成式人工智能》报告，李飞飞、Percy Liang等大牛评述GAI

专知会员服务

134+阅读 · 2023年3月15日

《将机器中的语言与大脑中的语言联系起来》150页博士论文，卡耐基梅隆大学

《将机器中的语言与大脑中的语言联系起来》150页博士论文，卡耐基梅隆大学

专知会员服务

48+阅读 · 2022年5月12日

最新【关于机器翻译评测研究的综述性报告 An Overview on Machine Translation Evaluation】Lifeng Han

最新【关于机器翻译评测研究的综述性报告 An Overview on Machine Translation Evaluation】Lifeng Han

专知会员服务

17+阅读 · 2022年2月25日

【剑桥大学】神经机器翻译综述论文，Neural Machine Translation: A Review，附88页pdf

【剑桥大学】神经机器翻译综述论文，Neural Machine Translation: A Review，附88页pdf

专知会员服务

37+阅读 · 2019年12月4日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

如何向ChatGPT问问题？这本手册《提问的艺术—让ChatGPT给出高质量答案》，提示工程技术全面指南，52页pdf

如何向ChatGPT问问题？这本手册《提问的艺术—让ChatGPT给出高质量答案》，提示工程技术全面指南，52页pdf

专知

27+阅读 · 2023年4月13日

CCCF专栏 | 朱晨光：机器阅读理解：如何让计算机读懂文章

CCCF专栏 | 朱晨光：机器阅读理解：如何让计算机读懂文章

中国计算机学会

24+阅读 · 2019年2月15日

书单 | 系统了解智能问答和机器翻译，从这两本书开始（文末有福利）

书单 | 系统了解智能问答和机器翻译，从这两本书开始（文末有福利）

微软研究院AI头条

24+阅读 · 2019年1月22日

机器翻译学术论文写作方法和技巧

机器翻译学术论文写作方法和技巧

清华大学研究生教育

11+阅读 · 2018年12月23日

NLG ≠ 机器写作 | 专家专栏

NLG ≠ 机器写作 | 专家专栏

量子位

13+阅读 · 2018年9月10日

中文NLP用什么？中文自然语言处理的完整机器处理流程

中文NLP用什么？中文自然语言处理的完整机器处理流程

人工智能头条

61+阅读 · 2018年9月5日

实践 | 如何使用深度学习为照片自动生成文本描述？

实践 | 如何使用深度学习为照片自动生成文本描述？

七月在线实验室

10+阅读 · 2018年5月21日

Deepmind 新成果，让机器挑战更复杂阅读理解问题

Deepmind 新成果，让机器挑战更复杂阅读理解问题

AI掘金志

11+阅读 · 2018年1月3日

清华大学：刘洋——基于深度学习的机器翻译

清华大学：刘洋——基于深度学习的机器翻译

人工智能学家

12+阅读 · 2017年11月13日

【干货】神经机器翻译全流程解析，one-shot 和 zero-shot 学习成亮点

【干货】神经机器翻译全流程解析，one-shot 和 zero-shot 学习成亮点

新智元

10+阅读 · 2017年4月2日

相关论文

Differentiating Between Human-Written and AI-Generated Texts Using Automatically Extracted Linguistic Features

Arxiv

0+阅读 · 2月17日

Can LLMs Automate Fact-Checking Article Writing?

Arxiv

0+阅读 · 2月10日

How University Disability Services Professionals Write Image Descriptions for HCI Figures Using Generative AI

Arxiv

0+阅读 · 2月9日

FAID: Fine-Grained AI-Generated Text Detection Using Multi-Task Auxiliary and Multi-Level Contrastive Learning

Arxiv

0+阅读 · 2月8日

From Crafting Text to Crafting Thought: Grounding AI Writing Support to Writing Center Pedagogy

Arxiv

0+阅读 · 2月3日

Agnostic Language Identification and Generation

Arxiv

0+阅读 · 1月30日

Benchmarking Machine Translation on Chinese Social Media Texts

Arxiv

0+阅读 · 1月30日

Understanding Reader Perception Shifts upon Disclosure of AI Authorship

Arxiv

0+阅读 · 1月22日

Who Owns the Text? Design Patterns for Preserving Authorship in AI-Assisted Writing

Arxiv

0+阅读 · 1月15日

Exploring the Effects of Generative AI Assistance on Writing Self-Efficacy

Arxiv

0+阅读 · 1月13日

相关基金

面向大类别的空中手写中英文识别技术研究

国家自然科学基金

2+阅读 · 2017年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

词典驱动的联机手写维吾尔文单词识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

联机手写维吾尔文基础数据库及识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

脱机手写藏文字符识别研究

国家自然科学基金

0+阅读 · 2014年12月31日

可重构的环境自适应RS码软判决译码器研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员