Author-in-the-Loop Response Generation and Evaluation: Integrating Author Expertise and Intent in Responses to Peer Review - 专知论文

会员服务 ·

0

Author-in-the-Loop Response Generation and Evaluation: Integrating Author Expertise and Intent in Responses to Peer Review

翻译：作者在环的审稿回应生成与评估：在同行评审回应中融合作者专业知识与意图

Qian Ruan,Iryna Gurevych

from arxiv, accepted to ACL 2026 Main Conference

Author response (rebuttal) writing is a critical stage of scientific peer review that demands substantial author effort. In practice, authors possess domain expertise, author-only information, and response strategies - concrete forms of author expertise and intent - and seek NLP assistance that integrates these signals into author response generation (ARG). Yet this author-in-the-loop paradigm lacks formal NLP formulation and systematic study: no dataset provides fine-grained author signals, existing ARG work lacks author inputs and controls, and no evaluation measures response reflection of author signals and effectiveness in addressing reviewer concerns. To fill these gaps, we introduce (i) Re3Align, the first large-scale dataset of aligned review-response-revision triplets, where revisions proxy author signals; (ii) REspGen, an author-in-the-loop ARG framework supporting flexible author input, multi-attribute control, and evaluation-guided refinement; and (iii) REspEval, a comprehensive evaluation suite with 20+ metrics spanning input utilization, controllability, response quality, and discourse. Experiments with SOTA LLMs demonstrate the benefits of author input and evaluation-guided refinement, the impact of input specificity on response quality, and controllability-quality trade-offs. We release our dataset, generation and evaluation tools.

翻译：作者回应（反驳）撰写是科学同行评审的关键阶段，需要作者投入大量精力。在实践中，作者拥有领域专业知识、仅作者知晓的信息以及回应策略——这些是作者专业知识和意图的具体体现——并寻求能够将这些信号融入作者回应生成（ARG）的自然语言处理辅助。然而，这种作者在环范式缺乏系统的自然语言处理建模与研究：没有数据集提供细粒度的作者信号，现有的ARG工作缺乏作者输入与控制，也没有评估指标衡量回应对作者信号的反映程度及其在解决评审者关切方面的有效性。为填补这些空白，我们提出：（i）Re3Align，首个大规模的对齐评审-回应-修订三元组数据集，其中修订版代理作者信号；（ii）REspGen，一个支持灵活作者输入、多属性控制和评估引导优化的作者在环ARG框架；（iii）REspEval，包含20多个指标的综合评估套件，涵盖输入利用、可控性、回应质量和话语维度。基于最先进大语言模型的实验表明，作者输入与评估引导优化具有优势，输入特异性影响回应质量，且存在可控性与质量之间的权衡。我们发布了数据集、生成工具与评估工具。

0

相关内容

大模型如何统一生成和嵌入？最新《生成式表示指令微调》论文详细解答

大模型如何统一生成和嵌入？最新《生成式表示指令微调》论文详细解答

专知会员服务

44+阅读 · 2024年2月18日

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

专知会员服务

52+阅读 · 2022年8月24日

如何做好科研？德国图宾根大学Andreas这份《科研阅读、写作与报告》82页PPT，手把手教你实操科研: 读写评讲论文

如何做好科研？德国图宾根大学Andreas这份《科研阅读、写作与报告》82页PPT，手把手教你实操科研: 读写评讲论文

专知会员服务

220+阅读 · 2022年4月13日

百度北京大学发布首篇《自然语言生成保真性》综述论文，52页pdf系统性阐述NLG分析、评价和优化方法

百度北京大学发布首篇《自然语言生成保真性》综述论文，52页pdf系统性阐述NLG分析、评价和优化方法

专知会员服务

28+阅读 · 2022年3月11日

【干货书】撰写和发表科研论文，216页专门为非英语科研工作者定制

【干货书】撰写和发表科研论文，216页专门为非英语科研工作者定制

专知会员服务

96+阅读 · 2021年7月9日

【SIGIR2021】基于知识图谱的增强连贯性文本规划的评论生成

【SIGIR2021】基于知识图谱的增强连贯性文本规划的评论生成

专知会员服务

31+阅读 · 2021年5月14日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知会员服务

78+阅读 · 2020年10月13日

最新《知识图谱复杂问答》综述论文，A Survey on Complex Question Answering over Knowledge Base: Recent Advances and Challenges

最新《知识图谱复杂问答》综述论文，A Survey on Complex Question Answering over Knowledge Base: Recent Advances and Challenges

专知会员服务

74+阅读 · 2020年7月28日

【AAAI2020论文】使用GANs生成科学文章的关键短语（Keyphrase Generation for Scientific Articles using GANs）

【AAAI2020论文】使用GANs生成科学文章的关键短语（Keyphrase Generation for Scientific Articles using GANs）

专知会员服务

22+阅读 · 2019年11月15日

【CCL 2019】ATT-第19期：文本生成 |Text Generation: From the Perspective of Interactive Inference （张家俊）

【CCL 2019】ATT-第19期：文本生成 |Text Generation: From the Perspective of Interactive Inference （张家俊）

专知会员服务

43+阅读 · 2019年11月12日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

26+阅读 · 2020年10月14日

机器翻译学术论文写作方法和技巧

机器翻译学术论文写作方法和技巧

清华大学研究生教育

11+阅读 · 2018年12月23日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

专知

11+阅读 · 2018年6月4日

【论文推荐】最新八篇生成对抗网络相关论文—条件翻译、RGB-D动作识别、量子生成对抗网络、语义对齐、视频摘要、视觉-文本注意力

【论文推荐】最新八篇生成对抗网络相关论文—条件翻译、RGB-D动作识别、量子生成对抗网络、语义对齐、视频摘要、视觉-文本注意力

专知

15+阅读 · 2018年5月15日

【论文推荐】最新八篇图像描述生成相关论文—比较级对抗学习、正则化RNNs、深层网络、视觉对话、婴儿说话、自我检索

【论文推荐】最新八篇图像描述生成相关论文—比较级对抗学习、正则化RNNs、深层网络、视觉对话、婴儿说话、自我检索

专知

10+阅读 · 2018年4月12日

【论文推荐】最新6篇图像描述生成相关论文—语言为枢纽、细粒度、生成器、注意力机制、策略梯度优化、判别性目标

【论文推荐】最新6篇图像描述生成相关论文—语言为枢纽、细粒度、生成器、注意力机制、策略梯度优化、判别性目标

专知

11+阅读 · 2018年3月20日

每周论文清单：高质量文本生成，多模态情感分析，还有一大波GAN | PaperDaily #26

每周论文清单：高质量文本生成，多模态情感分析，还有一大波GAN | PaperDaily #26

PaperWeekly

12+阅读 · 2017年12月14日

【专知独家干货】-《科研写作之读论文》的一些心得体会

【专知独家干货】-《科研写作之读论文》的一些心得体会

专知

36+阅读 · 2017年9月20日

第二语言韵律焦点产出、合成与评价的研究

国家自然科学基金

0+阅读 · 2015年12月31日

读者视角的跨领域隐式情感分析理论及关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向交互式问答的省略恢复技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

社交网络环境下基于协同过滤的上下文感知推荐系统研究

国家自然科学基金

6+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

不同重构措施复垦土壤水氮运移和作物生长模拟与响应机制

国家自然科学基金

0+阅读 · 2014年12月31日

战略环境评价有效性评估指标体系与评估方法研究

国家自然科学基金

10+阅读 · 2013年12月31日

PAPERMIND: Benchmarking Agentic Reasoning and Critique over Scientific Papers in Multimodal LLMs

Arxiv

0+阅读 · 4月23日

Peerispect: Claim Verification in Scientific Peer Reviews

Arxiv

0+阅读 · 4月19日

FactReview: Evidence-Grounded Reviews with Literature Positioning and Execution-Based Claim Verification

Arxiv

0+阅读 · 4月7日

Beyond Paper-to-Paper: Structured Profiling and Rubric Scoring for Paper-Reviewer Matching

Arxiv

0+阅读 · 4月7日

MetaCues: Enabling Critical Engagement with Generative AI for Information Seeking and Sensemaking

Arxiv

0+阅读 · 3月20日

Diagnosing and Repairing Citation Failures in Generative Engine Optimization

Arxiv

0+阅读 · 3月10日

Detecting AI-Generated Essays in Writing Assessment: Responsible Use and Generalizability Across LLMs

Arxiv

0+阅读 · 3月4日

APRES: An Agentic Paper Revision and Evaluation System

Arxiv

0+阅读 · 3月3日

TableTale: Reviving the Narrative Interplay Between Data Tables and Text in Scientific Papers

Arxiv

0+阅读 · 2月26日

Investigating Writing Professionals' Relationships with Generative AI: How Combined Perceptions of Rivalry and Collaboration Shape Work Practices and Outcomes

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

最新内容

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

5+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

2+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

1+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

1+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

6+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

5+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

9+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

7+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

10+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

相关VIP内容

大模型如何统一生成和嵌入？最新《生成式表示指令微调》论文详细解答

大模型如何统一生成和嵌入？最新《生成式表示指令微调》论文详细解答

专知会员服务

44+阅读 · 2024年2月18日

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

专知会员服务

52+阅读 · 2022年8月24日

如何做好科研？德国图宾根大学Andreas这份《科研阅读、写作与报告》82页PPT，手把手教你实操科研: 读写评讲论文

如何做好科研？德国图宾根大学Andreas这份《科研阅读、写作与报告》82页PPT，手把手教你实操科研: 读写评讲论文

专知会员服务

220+阅读 · 2022年4月13日

百度北京大学发布首篇《自然语言生成保真性》综述论文，52页pdf系统性阐述NLG分析、评价和优化方法

百度北京大学发布首篇《自然语言生成保真性》综述论文，52页pdf系统性阐述NLG分析、评价和优化方法

专知会员服务

28+阅读 · 2022年3月11日

【干货书】撰写和发表科研论文，216页专门为非英语科研工作者定制

【干货书】撰写和发表科研论文，216页专门为非英语科研工作者定制

专知会员服务

96+阅读 · 2021年7月9日

【SIGIR2021】基于知识图谱的增强连贯性文本规划的评论生成

【SIGIR2021】基于知识图谱的增强连贯性文本规划的评论生成

专知会员服务

31+阅读 · 2021年5月14日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知会员服务

78+阅读 · 2020年10月13日

最新《知识图谱复杂问答》综述论文，A Survey on Complex Question Answering over Knowledge Base: Recent Advances and Challenges

最新《知识图谱复杂问答》综述论文，A Survey on Complex Question Answering over Knowledge Base: Recent Advances and Challenges

专知会员服务

74+阅读 · 2020年7月28日

【AAAI2020论文】使用GANs生成科学文章的关键短语（Keyphrase Generation for Scientific Articles using GANs）

【AAAI2020论文】使用GANs生成科学文章的关键短语（Keyphrase Generation for Scientific Articles using GANs）

专知会员服务

22+阅读 · 2019年11月15日

【CCL 2019】ATT-第19期：文本生成 |Text Generation: From the Perspective of Interactive Inference （张家俊）

【CCL 2019】ATT-第19期：文本生成 |Text Generation: From the Perspective of Interactive Inference （张家俊）

专知会员服务

43+阅读 · 2019年11月12日

热门VIP内容

开通专知VIP会员享更多权益服务

巡飞弹与反无人机系统——现代战场的两大支柱

《北约数字教官网络发展路径》128页报告

无人机自主控制与人工智能：系统性综述

《打造“黄金舰队”》57页报告

相关资讯

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

26+阅读 · 2020年10月14日

机器翻译学术论文写作方法和技巧

机器翻译学术论文写作方法和技巧

清华大学研究生教育

11+阅读 · 2018年12月23日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

专知

11+阅读 · 2018年6月4日

【论文推荐】最新八篇生成对抗网络相关论文—条件翻译、RGB-D动作识别、量子生成对抗网络、语义对齐、视频摘要、视觉-文本注意力

【论文推荐】最新八篇生成对抗网络相关论文—条件翻译、RGB-D动作识别、量子生成对抗网络、语义对齐、视频摘要、视觉-文本注意力

专知

15+阅读 · 2018年5月15日

【论文推荐】最新八篇图像描述生成相关论文—比较级对抗学习、正则化RNNs、深层网络、视觉对话、婴儿说话、自我检索

【论文推荐】最新八篇图像描述生成相关论文—比较级对抗学习、正则化RNNs、深层网络、视觉对话、婴儿说话、自我检索

专知

10+阅读 · 2018年4月12日

【论文推荐】最新6篇图像描述生成相关论文—语言为枢纽、细粒度、生成器、注意力机制、策略梯度优化、判别性目标

【论文推荐】最新6篇图像描述生成相关论文—语言为枢纽、细粒度、生成器、注意力机制、策略梯度优化、判别性目标

专知

11+阅读 · 2018年3月20日

每周论文清单：高质量文本生成，多模态情感分析，还有一大波GAN | PaperDaily #26

每周论文清单：高质量文本生成，多模态情感分析，还有一大波GAN | PaperDaily #26

PaperWeekly

12+阅读 · 2017年12月14日

【专知独家干货】-《科研写作之读论文》的一些心得体会

【专知独家干货】-《科研写作之读论文》的一些心得体会

专知

36+阅读 · 2017年9月20日

相关论文

PAPERMIND: Benchmarking Agentic Reasoning and Critique over Scientific Papers in Multimodal LLMs

Arxiv

0+阅读 · 4月23日

Peerispect: Claim Verification in Scientific Peer Reviews

Arxiv

0+阅读 · 4月19日

FactReview: Evidence-Grounded Reviews with Literature Positioning and Execution-Based Claim Verification

Arxiv

0+阅读 · 4月7日

Beyond Paper-to-Paper: Structured Profiling and Rubric Scoring for Paper-Reviewer Matching

Arxiv

0+阅读 · 4月7日

MetaCues: Enabling Critical Engagement with Generative AI for Information Seeking and Sensemaking

Arxiv

0+阅读 · 3月20日

Diagnosing and Repairing Citation Failures in Generative Engine Optimization

Arxiv

0+阅读 · 3月10日

Detecting AI-Generated Essays in Writing Assessment: Responsible Use and Generalizability Across LLMs

Arxiv

0+阅读 · 3月4日

APRES: An Agentic Paper Revision and Evaluation System

Arxiv

0+阅读 · 3月3日

TableTale: Reviving the Narrative Interplay Between Data Tables and Text in Scientific Papers

Arxiv

0+阅读 · 2月26日

Investigating Writing Professionals' Relationships with Generative AI: How Combined Perceptions of Rivalry and Collaboration Shape Work Practices and Outcomes

Arxiv

0+阅读 · 2月20日

相关基金

第二语言韵律焦点产出、合成与评价的研究

国家自然科学基金

0+阅读 · 2015年12月31日

读者视角的跨领域隐式情感分析理论及关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向交互式问答的省略恢复技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

社交网络环境下基于协同过滤的上下文感知推荐系统研究

国家自然科学基金

6+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

不同重构措施复垦土壤水氮运移和作物生长模拟与响应机制

国家自然科学基金

0+阅读 · 2014年12月31日

战略环境评价有效性评估指标体系与评估方法研究

国家自然科学基金

10+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员