The Effect of Idea Elaboration on the Automatic Assessment of Idea Originality - 专知论文

会员服务 ·

0

系统 · 精细度 · 细度 · 偏差 · 自动评估 ·

The Effect of Idea Elaboration on the Automatic Assessment of Idea Originality

翻译：创意构思精细度对创意原创性自动评估的影响

Umberto Domanti,Moritz Mock,Sergio Agnoli,Antonella De Angeli

Automatic systems are increasingly used to assess the originality of responses in creative tasks. They offer a potential solution to key limitations of human assessment (cost, fatigue, and subjectivity), but there is preliminary evidence of a self-preference bias. Accordingly, automatic systems tend to prefer outcomes that are more closely related to their style, rather than to the human one. In this paper, we investigated how Large Language Models (LLMs) align with human raters in assessing the originality of responses in a divergent thinking task. We analysed 4,813 responses to the Alternate Uses Task produced by higher and lower creative humans and ChatGPT-4o. Human raters were two university students who underwent intensive training. Machine raters were two specialised systems fine-tuned on AUT responses and corresponding human ratings (OCSAI and CLAUS) and ChatGPT-4o, which was prompted with the same instructions as human raters. Results confirmed the presence of a self-preference bias in LLMs. Automatic systems tended to privilege artificial responses. However, this self-preference bias disappeared when the analyses controlled for the idea elaboration. We discuss theoretical and methodological implications of these findings by highlighting future directions for research on creativity assessment.

翻译：自动系统越来越多地被用于评估创意任务中回答的原创性。它们为人类评估的关键局限（成本、疲劳和主观性）提供了潜在解决方案，但有初步证据表明存在一种自我偏好偏差。据此，自动系统倾向于偏好更接近其自身风格而非人类风格的结果。在本文中，我们研究了大型语言模型在评估发散思维任务回答原创性时与人类评分者的一致性。我们分析了由高低创造力人类与ChatGPT-4o产生的4,813条对“替代用途任务”的回答。人类评分者为两名经过强化培训的大学生。机器评分者为两个在AUT回答及对应人类评分上微调的特化系统（OCSAI与CLAUS）以及ChatGPT-4o，后者被施以与人类评分者相同的指令。结果证实了大型语言模型中存在自我偏好偏差。自动系统倾向于偏爱人工回答。然而，当分析控制了创意构思精细度后，这种自我偏好偏差消失了。我们通过强调创造力评估研究的未来方向，讨论了这些发现的理论与方法学启示。

0

相关内容

【斯坦福博士论文】持续自我改进的人工智能

【斯坦福博士论文】持续自我改进的人工智能

专知会员服务

15+阅读 · 3月22日

文本、视觉与语音生成的自动化评估方法综述

文本、视觉与语音生成的自动化评估方法综述

专知会员服务

20+阅读 · 2025年6月15日

在杀手机器人与完美人工智能之间：重新评估自主性的军事影响

在杀手机器人与完美人工智能之间：重新评估自主性的军事影响

专知会员服务

34+阅读 · 2023年11月27日

人机协作《评估影响信任校准的因素：信任战略和风险的影响》美空军21页报告

人机协作《评估影响信任校准的因素：信任战略和风险的影响》美空军21页报告

专知会员服务

32+阅读 · 2023年7月18日

【博士论文】《创意生成和评估工具箱：用机器学习、数据驱动和竞赛驱动的方法来支持创意生成》斯德哥尔摩大学2022最新论文

【博士论文】《创意生成和评估工具箱：用机器学习、数据驱动和竞赛驱动的方法来支持创意生成》斯德哥尔摩大学2022最新论文

专知会员服务

22+阅读 · 2022年9月4日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

基于生成模型的闲聊机器人自动评价方法综述

专知会员服务

33+阅读 · 2021年4月18日

最新《自动机器学习》综述论文，AutoML: A Survey of the State-of-the-Art

最新《自动机器学习》综述论文，AutoML: A Survey of the State-of-the-Art

专知会员服务

93+阅读 · 2020年7月10日

自然语言处理中的注意力机制，Attention in Natural Language Processing

自然语言处理中的注意力机制，Attention in Natural Language Processing

专知会员服务

136+阅读 · 2020年5月30日

【文章|自注意力(self-attention)机制图解】《Illustrated: Self-Attention》by Raimi Karim

【文章|自注意力(self-attention)机制图解】《Illustrated: Self-Attention》by Raimi Karim

专知会员服务

45+阅读 · 2019年11月18日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

深度 | 推荐系统评估

深度 | 推荐系统评估

AI100

24+阅读 · 2019年3月16日

自注意力机制在计算机视觉中的应用

自注意力机制在计算机视觉中的应用

GAN生成式对抗网络

19+阅读 · 2018年12月20日

注意力机制(Attention)最新综述论文及相关源码

注意力机制(Attention)最新综述论文及相关源码

人工智能学家

30+阅读 · 2018年11月17日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

【论文推荐】最新七篇推荐系统相关论文—影响兴趣、知识Embeddings、音乐推荐、非结构化、一致性、显式和隐式特征、知识图谱

【论文推荐】最新七篇推荐系统相关论文—影响兴趣、知识Embeddings、音乐推荐、非结构化、一致性、显式和隐式特征、知识图谱

专知

14+阅读 · 2018年3月28日

干货！自然语言处理中的自注意力机制！

干货！自然语言处理中的自注意力机制！

全球人工智能

11+阅读 · 2018年3月27日

【论文推荐】最新七篇自注意力机制(Self-attention)相关论文—结构化自注意力、相对位置、混合、句子表达、文本向量

【论文推荐】最新七篇自注意力机制(Self-attention)相关论文—结构化自注意力、相对位置、混合、句子表达、文本向量

专知

29+阅读 · 2018年3月12日

【论文推荐】最新六篇自动问答（QA）相关论文—复杂序列问答、注意力机制、长短时记忆、文本推理、多因素注意力、主动的问答智能体

【论文推荐】最新六篇自动问答（QA）相关论文—复杂序列问答、注意力机制、长短时记忆、文本推理、多因素注意力、主动的问答智能体

专知

18+阅读 · 2018年2月22日

深度学习中的注意力机制

深度学习中的注意力机制

人工智能头条

16+阅读 · 2017年11月2日

创意产业集群的动态演化机制及对城市发展的影响研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

抽象知识对设计思维的影响机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

创造力的负效应及机制研究：社会网络的视角

国家自然科学基金

1+阅读 · 2015年12月31日

知觉学习影响视觉刺激显著性的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

面向情感认知的产品造型特征与用户意象需求层次映射机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

技术多元化对企业持续创新的影响及其作用机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

外部激励对网络口碑传播行为和说服力的影响：基于大数据分析和行为实验的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

负面在线评论和商家反馈对消费者个体态度和群体观点演化的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

From 0-to-1 to 1-to-N: Reproducible Engineering Evidence for MetaAI Recursive Self-Design

Arxiv

0+阅读 · 6月8日

Are We Truly Innovating? A Qualitative and Quantitative Study of Originality in AI Research Papers

Arxiv

0+阅读 · 5月27日

SIEVES: Selective Prediction Generalizes through Visual Evidence Scoring

Arxiv

0+阅读 · 4月28日

Responsible Evaluation of AI for Mental Health

Arxiv

0+阅读 · 4月28日

How Personal Characteristics Shape User Exploration of Diverse Movie Recommendations with a LLM-Based Multi-Agent System

Arxiv

0+阅读 · 4月27日

A Systems Thinking Approach to Algorithmic Fairness

Arxiv

0+阅读 · 4月23日

Evaluating the Reliability and Fidelity of Automated Judgment Systems of Large Language Models

Arxiv

0+阅读 · 3月23日

RubricRAG: Towards Interpretable and Reliable LLM Evaluation via Domain Knowledge Retrieval for Rubric Generation

Arxiv

0+阅读 · 3月21日

The production of meaning in the processing of natural language

Arxiv

0+阅读 · 3月20日

Hallucination Detection in Foundation Models for Decision-Making: A Flexible Definition and Review of the State of the Art

Arxiv

14+阅读 · 2024年3月25日

VIP会员

文章信息

相关主题

最新内容

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

10+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

3+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

3+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

2+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

9+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

7+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

10+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

相关VIP内容

【斯坦福博士论文】持续自我改进的人工智能

【斯坦福博士论文】持续自我改进的人工智能

专知会员服务

15+阅读 · 3月22日

文本、视觉与语音生成的自动化评估方法综述

文本、视觉与语音生成的自动化评估方法综述

专知会员服务

20+阅读 · 2025年6月15日

在杀手机器人与完美人工智能之间：重新评估自主性的军事影响

在杀手机器人与完美人工智能之间：重新评估自主性的军事影响

专知会员服务

34+阅读 · 2023年11月27日

人机协作《评估影响信任校准的因素：信任战略和风险的影响》美空军21页报告

人机协作《评估影响信任校准的因素：信任战略和风险的影响》美空军21页报告

专知会员服务

32+阅读 · 2023年7月18日

【博士论文】《创意生成和评估工具箱：用机器学习、数据驱动和竞赛驱动的方法来支持创意生成》斯德哥尔摩大学2022最新论文

【博士论文】《创意生成和评估工具箱：用机器学习、数据驱动和竞赛驱动的方法来支持创意生成》斯德哥尔摩大学2022最新论文

专知会员服务

22+阅读 · 2022年9月4日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

基于生成模型的闲聊机器人自动评价方法综述

专知会员服务

33+阅读 · 2021年4月18日

最新《自动机器学习》综述论文，AutoML: A Survey of the State-of-the-Art

最新《自动机器学习》综述论文，AutoML: A Survey of the State-of-the-Art

专知会员服务

93+阅读 · 2020年7月10日

自然语言处理中的注意力机制，Attention in Natural Language Processing

自然语言处理中的注意力机制，Attention in Natural Language Processing

专知会员服务

136+阅读 · 2020年5月30日

【文章|自注意力(self-attention)机制图解】《Illustrated: Self-Attention》by Raimi Karim

【文章|自注意力(self-attention)机制图解】《Illustrated: Self-Attention》by Raimi Karim

专知会员服务

45+阅读 · 2019年11月18日

热门VIP内容

开通专知VIP会员享更多权益服务

巡飞弹与反无人机系统——现代战场的两大支柱

《北约数字教官网络发展路径》128页报告

无人机自主控制与人工智能：系统性综述

《打造“黄金舰队”》57页报告

相关资讯

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

深度 | 推荐系统评估

深度 | 推荐系统评估

AI100

24+阅读 · 2019年3月16日

自注意力机制在计算机视觉中的应用

自注意力机制在计算机视觉中的应用

GAN生成式对抗网络

19+阅读 · 2018年12月20日

注意力机制(Attention)最新综述论文及相关源码

注意力机制(Attention)最新综述论文及相关源码

人工智能学家

30+阅读 · 2018年11月17日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

【论文推荐】最新七篇推荐系统相关论文—影响兴趣、知识Embeddings、音乐推荐、非结构化、一致性、显式和隐式特征、知识图谱

【论文推荐】最新七篇推荐系统相关论文—影响兴趣、知识Embeddings、音乐推荐、非结构化、一致性、显式和隐式特征、知识图谱

专知

14+阅读 · 2018年3月28日

干货！自然语言处理中的自注意力机制！

干货！自然语言处理中的自注意力机制！

全球人工智能

11+阅读 · 2018年3月27日

【论文推荐】最新七篇自注意力机制(Self-attention)相关论文—结构化自注意力、相对位置、混合、句子表达、文本向量

【论文推荐】最新七篇自注意力机制(Self-attention)相关论文—结构化自注意力、相对位置、混合、句子表达、文本向量

专知

29+阅读 · 2018年3月12日

【论文推荐】最新六篇自动问答（QA）相关论文—复杂序列问答、注意力机制、长短时记忆、文本推理、多因素注意力、主动的问答智能体

【论文推荐】最新六篇自动问答（QA）相关论文—复杂序列问答、注意力机制、长短时记忆、文本推理、多因素注意力、主动的问答智能体

专知

18+阅读 · 2018年2月22日

深度学习中的注意力机制

深度学习中的注意力机制

人工智能头条

16+阅读 · 2017年11月2日

相关论文

From 0-to-1 to 1-to-N: Reproducible Engineering Evidence for MetaAI Recursive Self-Design

Arxiv

0+阅读 · 6月8日

Are We Truly Innovating? A Qualitative and Quantitative Study of Originality in AI Research Papers

Arxiv

0+阅读 · 5月27日

SIEVES: Selective Prediction Generalizes through Visual Evidence Scoring

Arxiv

0+阅读 · 4月28日

Responsible Evaluation of AI for Mental Health

Arxiv

0+阅读 · 4月28日

How Personal Characteristics Shape User Exploration of Diverse Movie Recommendations with a LLM-Based Multi-Agent System

Arxiv

0+阅读 · 4月27日

A Systems Thinking Approach to Algorithmic Fairness

Arxiv

0+阅读 · 4月23日

Evaluating the Reliability and Fidelity of Automated Judgment Systems of Large Language Models

Arxiv

0+阅读 · 3月23日

RubricRAG: Towards Interpretable and Reliable LLM Evaluation via Domain Knowledge Retrieval for Rubric Generation

Arxiv

0+阅读 · 3月21日

The production of meaning in the processing of natural language

Arxiv

0+阅读 · 3月20日

Hallucination Detection in Foundation Models for Decision-Making: A Flexible Definition and Review of the State of the Art

Arxiv

14+阅读 · 2024年3月25日

相关基金

创意产业集群的动态演化机制及对城市发展的影响研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

抽象知识对设计思维的影响机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

创造力的负效应及机制研究：社会网络的视角

国家自然科学基金

1+阅读 · 2015年12月31日

知觉学习影响视觉刺激显著性的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

面向情感认知的产品造型特征与用户意象需求层次映射机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

技术多元化对企业持续创新的影响及其作用机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

外部激励对网络口碑传播行为和说服力的影响：基于大数据分析和行为实验的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

负面在线评论和商家反馈对消费者个体态度和群体观点演化的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员