Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios - 专知论文

会员服务 ·

0

质量评估 · 机器翻译 · 低资源 · 适配 · 样本 ·

Domain-Specific Quality Estimation for Machine Translation in Low-Resource Scenarios

翻译：面向低资源场景的领域特定机器翻译质量评估

Namrata Patil Gurav,Akashdeep Ranu,Archchana Sindhujan,Diptesh Kanojia

from arxiv, 21 pages, 7 tables, 7 figures

Quality Estimation (QE) is essential for assessing machine translation quality in reference-less settings, particularly for domain-specific and low-resource language scenarios. In this paper, we investigate sentence-level QE for English to Indic machine translation across four domains (Healthcare, Legal, Tourism, and General) and five language pairs. We systematically compare zero-shot, few-shot, and guideline-anchored prompting across selected closed-weight and open-weight LLMs. Findings indicate that while closed-weight models achieve strong performance via prompting alone, prompt-only approaches remain fragile for open-weight models, especially in high-risk domains. To address this, we adopt ALOPE, a framework for LLM-based QE that uses Low-Rank Adaptation with regression heads attached to selected intermediate Transformer layers. We also extend ALOPE with recently proposed Low-Rank Multiplicative Adaptation (LoRMA). Our results show that intermediate-layer adaptation consistently improves QE performance, with gains in semantically complex domains, indicating a path toward more robust QE in practical scenarios. We release code and domain-specific QE datasets publicly to support further research.

翻译：质量评估(QE)在无参考译文的场景下对机器翻译质量进行评判至关重要，尤其对于领域特定和低资源语言场景。本文针对英语到印度语系语言的机器翻译，在四个领域（医疗健康、法律、旅游和通用领域）及五组语言对上研究了句子级质量评估。我们系统比较了在选定的闭源权重与开源权重大语言模型(LLM)上采用零样本、少样本及基于指导原则的提示方法的效果。研究发现，虽然闭源权重模型仅通过提示即可获得强劲性能，但纯提示方法对于开源权重模型而言仍显脆弱，尤其在风险较高的领域。为解决此问题，我们采用ALOPE框架——一种基于大语言模型的质量评估方法，该方法将低秩适配与回归头结合，并附加到选定的Transformer中间层。我们还使用近期提出的低秩乘性适配(LoRMA)对ALOPE进行了扩展。结果表明，中间层适配能持续提升质量评估性能，在语义复杂的领域收益尤为显著，这为实际场景中实现更鲁棒的质量评估指明了一条路径。我们公开了代码和领域特定的质量评估数据集以支持进一步研究。

0

相关内容

质量评估

【阿姆斯特丹博士论文】探索低资源神经机器翻译的解决方案

【阿姆斯特丹博士论文】探索低资源神经机器翻译的解决方案

专知会员服务

13+阅读 · 2024年11月28日

【博士论文】⾮⾃回归神经机器翻译的训练⽅法研究

【博士论文】⾮⾃回归神经机器翻译的训练⽅法研究

专知会员服务

20+阅读 · 2023年12月9日

机器音译研究综述

机器音译研究综述

专知会员服务

17+阅读 · 2022年10月16日

「机器翻译评测研究」最新2022综述

「机器翻译评测研究」最新2022综述

专知会员服务

38+阅读 · 2022年3月13日

神经机器翻译的域自适应综述论文，64页pdf

专知会员服务

17+阅读 · 2021年4月16日

最新《机器翻译》进展报告，纽约大学Kyunghyun Cho讲解，附50页ppt

专知会员服务

31+阅读 · 2021年1月25日

稀缺资源语言神经网络机器翻译研究综述

稀缺资源语言神经网络机器翻译研究综述

专知会员服务

28+阅读 · 2020年12月2日

【论文】多语言神经机器翻译综述（A Comprehensive Survey of Multilingual Neural Machine Translation）

【论文】多语言神经机器翻译综述（A Comprehensive Survey of Multilingual Neural Machine Translation）

专知会员服务

20+阅读 · 2020年1月7日

【剑桥大学】神经机器翻译综述论文，Neural Machine Translation: A Review，附88页pdf

【剑桥大学】神经机器翻译综述论文，Neural Machine Translation: A Review，附88页pdf

专知会员服务

37+阅读 · 2019年12月4日

【CCL 2019】机器翻译前沿综述，中国科学院计算技术研究所冯洋博士

【CCL 2019】机器翻译前沿综述，中国科学院计算技术研究所冯洋博士

专知会员服务

43+阅读 · 2019年11月12日

【Facebook AI】低资源机器翻译，74页ppt

【Facebook AI】低资源机器翻译，74页ppt

专知

10+阅读 · 2020年4月8日

【翻译技术速递】测评：免费的术语抽取工具

【翻译技术速递】测评：免费的术语抽取工具

翻译技术沙龙

139+阅读 · 2019年11月2日

【综述】多语言神经机器翻译最新综述，附全文下载

【综述】多语言神经机器翻译最新综述，附全文下载

专知

32+阅读 · 2019年5月15日

清华大学NLP组年末巨献：机器翻译必读论文列表

清华大学NLP组年末巨献：机器翻译必读论文列表

机器之心

13+阅读 · 2018年12月30日

机器翻译学术论文写作方法和技巧

机器翻译学术论文写作方法和技巧

清华大学研究生教育

11+阅读 · 2018年12月23日

【论文推荐】最新十篇机器翻译相关论文—自然语言推理、无监督神经机器翻译、多任务学习、局部卷积、图卷积、多语种机器翻译

【论文推荐】最新十篇机器翻译相关论文—自然语言推理、无监督神经机器翻译、多任务学习、局部卷积、图卷积、多语种机器翻译

专知

15+阅读 · 2018年5月1日

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器学习研究会

12+阅读 · 2017年12月24日

清华大学：刘洋——基于深度学习的机器翻译

清华大学：刘洋——基于深度学习的机器翻译

人工智能学家

12+阅读 · 2017年11月13日

【干货】神经机器翻译全流程解析，one-shot 和 zero-shot 学习成亮点

【干货】神经机器翻译全流程解析，one-shot 和 zero-shot 学习成亮点

新智元

10+阅读 · 2017年4月2日

自然语言处理（二）机器翻译篇 (NLP: machine translation)

自然语言处理（二）机器翻译篇 (NLP: machine translation)

DeepLearning中文论坛

12+阅读 · 2015年7月1日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心资源利用率敏感的编译方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于形态和多词的有限语料蒙汉互译调序优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

我国开放教育资源项目质量监测评价及质量保证策略研究——基于用户满意度视角

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于组合Hodge理论的图像视频质量评价方法

国家自然科学基金

0+阅读 · 2014年12月31日

基于潜在语义对偶空间的新词翻译自动识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

装备作战需求论证质量评估方法研究

国家自然科学基金

34+阅读 · 2012年12月31日

Bidirectional Chinese and English Passive Sentences Dataset for Machine Translation

Arxiv

0+阅读 · 3月16日

Large Language Models as Annotators for Machine Translation Quality Estimation

Arxiv

0+阅读 · 3月11日

Hindsight Quality Prediction Experiments in Multi-Candidate Human-Post-Edited Machine Translation

Arxiv

0+阅读 · 3月4日

Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets

Arxiv

0+阅读 · 2月25日

Evaluating Extremely Low-Resource Machine Translation: A Comparative Study of ChrF++ and BLEU Metrics

Arxiv

0+阅读 · 2月19日

Context Volume Drives Performance: Tackling Domain Shift in Extremely Low-Resource Translation via RAG

Arxiv

0+阅读 · 2月16日

Beyond Scalar Scores: Reinforcement Learning for Error-Aware Quality Estimation of Machine Translation

Arxiv

0+阅读 · 2月9日

MTQE.en-he: Machine Translation Quality Estimation for English-Hebrew

Arxiv

0+阅读 · 2月6日

Beyond Many-Shot Translation: Scaling In-Context Demonstrations For Low-Resource Machine Translation

Arxiv

0+阅读 · 2月4日

Disentangling meaning from language in LLM-based machine translation

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

专知会员服务

6+阅读 · 7月24日

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

专知会员服务

4+阅读 · 7月24日

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

专知会员服务

3+阅读 · 7月24日

乌克兰纵深打击如何重塑俄罗斯的战略选择

乌克兰纵深打击如何重塑俄罗斯的战略选择

专知会员服务

2+阅读 · 7月24日

《分布式太空任务对比分析与综合建模及仿真环境》120页

《分布式太空任务对比分析与综合建模及仿真环境》120页

专知会员服务

2+阅读 · 7月24日

俄乌战争中关于中程打击无人机部署的经验启示

俄乌战争中关于中程打击无人机部署的经验启示

专知会员服务

1+阅读 · 7月24日

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

专知会员服务

5+阅读 · 7月23日

《基于强化学习的自动化红队测试》

《基于强化学习的自动化红队测试》

专知会员服务

4+阅读 · 7月23日

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

专知会员服务

6+阅读 · 7月23日

“天降毒雾”：无人机如何使化学战重返乌克兰战场

“天降毒雾”：无人机如何使化学战重返乌克兰战场

专知会员服务

2+阅读 · 7月23日

伊朗不对称防空战略的演进

伊朗不对称防空战略的演进

专知会员服务

4+阅读 · 7月23日

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

11+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

4+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

8+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

11+阅读 · 7月22日

相关VIP内容

【阿姆斯特丹博士论文】探索低资源神经机器翻译的解决方案

【阿姆斯特丹博士论文】探索低资源神经机器翻译的解决方案

专知会员服务

13+阅读 · 2024年11月28日

【博士论文】⾮⾃回归神经机器翻译的训练⽅法研究

【博士论文】⾮⾃回归神经机器翻译的训练⽅法研究

专知会员服务

20+阅读 · 2023年12月9日

机器音译研究综述

机器音译研究综述

专知会员服务

17+阅读 · 2022年10月16日

「机器翻译评测研究」最新2022综述

「机器翻译评测研究」最新2022综述

专知会员服务

38+阅读 · 2022年3月13日

神经机器翻译的域自适应综述论文，64页pdf

专知会员服务

17+阅读 · 2021年4月16日

最新《机器翻译》进展报告，纽约大学Kyunghyun Cho讲解，附50页ppt

专知会员服务

31+阅读 · 2021年1月25日

稀缺资源语言神经网络机器翻译研究综述

稀缺资源语言神经网络机器翻译研究综述

专知会员服务

28+阅读 · 2020年12月2日

【论文】多语言神经机器翻译综述（A Comprehensive Survey of Multilingual Neural Machine Translation）

【论文】多语言神经机器翻译综述（A Comprehensive Survey of Multilingual Neural Machine Translation）

专知会员服务

20+阅读 · 2020年1月7日

【剑桥大学】神经机器翻译综述论文，Neural Machine Translation: A Review，附88页pdf

【剑桥大学】神经机器翻译综述论文，Neural Machine Translation: A Review，附88页pdf

专知会员服务

37+阅读 · 2019年12月4日

【CCL 2019】机器翻译前沿综述，中国科学院计算技术研究所冯洋博士

【CCL 2019】机器翻译前沿综述，中国科学院计算技术研究所冯洋博士

专知会员服务

43+阅读 · 2019年11月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

乌克兰纵深打击如何重塑俄罗斯的战略选择

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

相关资讯

【Facebook AI】低资源机器翻译，74页ppt

【Facebook AI】低资源机器翻译，74页ppt

专知

10+阅读 · 2020年4月8日

【翻译技术速递】测评：免费的术语抽取工具

【翻译技术速递】测评：免费的术语抽取工具

翻译技术沙龙

139+阅读 · 2019年11月2日

【综述】多语言神经机器翻译最新综述，附全文下载

【综述】多语言神经机器翻译最新综述，附全文下载

专知

32+阅读 · 2019年5月15日

清华大学NLP组年末巨献：机器翻译必读论文列表

清华大学NLP组年末巨献：机器翻译必读论文列表

机器之心

13+阅读 · 2018年12月30日

机器翻译学术论文写作方法和技巧

机器翻译学术论文写作方法和技巧

清华大学研究生教育

11+阅读 · 2018年12月23日

【论文推荐】最新十篇机器翻译相关论文—自然语言推理、无监督神经机器翻译、多任务学习、局部卷积、图卷积、多语种机器翻译

【论文推荐】最新十篇机器翻译相关论文—自然语言推理、无监督神经机器翻译、多任务学习、局部卷积、图卷积、多语种机器翻译

专知

15+阅读 · 2018年5月1日

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器学习研究会

12+阅读 · 2017年12月24日

清华大学：刘洋——基于深度学习的机器翻译

清华大学：刘洋——基于深度学习的机器翻译

人工智能学家

12+阅读 · 2017年11月13日

【干货】神经机器翻译全流程解析，one-shot 和 zero-shot 学习成亮点

【干货】神经机器翻译全流程解析，one-shot 和 zero-shot 学习成亮点

新智元

10+阅读 · 2017年4月2日

自然语言处理（二）机器翻译篇 (NLP: machine translation)

自然语言处理（二）机器翻译篇 (NLP: machine translation)

DeepLearning中文论坛

12+阅读 · 2015年7月1日

相关论文

Bidirectional Chinese and English Passive Sentences Dataset for Machine Translation

Arxiv

0+阅读 · 3月16日

Large Language Models as Annotators for Machine Translation Quality Estimation

Arxiv

0+阅读 · 3月11日

Hindsight Quality Prediction Experiments in Multi-Candidate Human-Post-Edited Machine Translation

Arxiv

0+阅读 · 3月4日

Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets

Arxiv

0+阅读 · 2月25日

Evaluating Extremely Low-Resource Machine Translation: A Comparative Study of ChrF++ and BLEU Metrics

Arxiv

0+阅读 · 2月19日

Context Volume Drives Performance: Tackling Domain Shift in Extremely Low-Resource Translation via RAG

Arxiv

0+阅读 · 2月16日

Beyond Scalar Scores: Reinforcement Learning for Error-Aware Quality Estimation of Machine Translation

Arxiv

0+阅读 · 2月9日

MTQE.en-he: Machine Translation Quality Estimation for English-Hebrew

Arxiv

0+阅读 · 2月6日

Beyond Many-Shot Translation: Scaling In-Context Demonstrations For Low-Resource Machine Translation

Arxiv

0+阅读 · 2月4日

Disentangling meaning from language in LLM-based machine translation

Arxiv

0+阅读 · 2月4日

相关基金

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心资源利用率敏感的编译方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于形态和多词的有限语料蒙汉互译调序优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

我国开放教育资源项目质量监测评价及质量保证策略研究——基于用户满意度视角

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于组合Hodge理论的图像视频质量评价方法

国家自然科学基金

0+阅读 · 2014年12月31日

基于潜在语义对偶空间的新词翻译自动识别方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

装备作战需求论证质量评估方法研究

国家自然科学基金

34+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员