Multilingual Humour-Aware Retrieval with Dense and Re-Ranking Models

Humour-aware information retrieval poses unique challenges beyond standard semantic retrieval, as systems must account not only for topical relevance but also for humour-specific linguistic phenomena such as wordplay, phonetic ambiguity, and polysemy. In this paper, Team DUTH studies multilingual humour-aware information retrieval using the CLEF 2025 JOKER Task 1 benchmark, which evaluates humour retrieval in English and Portuguese. Our approach combines multilingual XLM-RoBERTa-based dense retrieval with additional system variants, including neural re-ranking, in order to assess the extent to which general-purpose Transformer models can capture humour-specific relevance. The results reveal substantial cross-lingual variation. While the Portuguese runs demonstrate comparatively strong performance across MAP, MRR, and early precision metrics, the English runs perform significantly worse, with relevant humorous documents frequently appearing at lower ranks. These findings highlight the limitations of purely semantic dense representations for humour retrieval, particularly when humour depends on surface-level cues that are not explicitly modelled by multilingual encoders. We further analyse contributing factors to this discrepancy, including dataset characteristics, query-document alignment, and variation in humour mechanisms. Overall, the Team DUTH experiments establish multilingual dense-retrieval and re-ranking baselines and provide insights into the challenges of modelling humour-aware relevance within the JOKER framework.

翻译：幽默感知信息检索面临着超越标准语义检索的独特挑战，系统不仅要考虑主题相关性，还必须处理幽默特有的语言现象，如文字游戏、语音歧义和多义词。本文中，DUTH团队利用CLEF 2025 JOKER第一任务基准数据集（该基准评估英语和葡萄牙语的幽默检索效果）开展多语言幽默感知信息检索研究。我们的方法结合了基于XLM-RoBERTa的多语言稠密检索与包括神经重排序在内的多种系统变体，旨在评估通用Transformer模型捕捉幽默特定相关性的能力。研究结果揭示了显著的跨语言差异。葡萄牙语实验在MAP、MRR及早期精确率指标上表现相对出色，而英语实验性能明显较差，相关幽默文档往往出现在较低的排序位置。这些发现凸显了纯语义稠密表征在幽默检索中的局限性——当幽默依赖于多语言编码器未明确建模的表面线索时尤为突出。我们进一步分析了导致这一差异的潜在因素，包括数据集特征、查询-文档对齐度及幽默机制变化。总体而言，DUTH团队的实验为多语言稠密检索与重排序建立了基准，并为在JOKER框架内建模幽默感知相关性面临的挑战提供了见解。

相关内容

排序

关注 313

排序是计算机内经常进行的一种操作，其目的是将一组“无序”的记录序列调整为“有序”的记录序列。分内部排序和外部排序。若整个排序过程不需要访问外存便能完成，则称此类排序问题为内部排序。反之，若参加排序的记录数量很大，整个序列的排序过程不可能在内存中完成，则称此类排序问题为外部排序。内部排序的过程是一个逐步扩大记录的有序序列长度的过程。

从感知到推理：深度思考赋能多模态大语言模型

专知会员服务

26+阅读 · 2025年11月19日

从感知到认知：多模态大语言模型中视觉-语言交互推理综述

专知会员服务

32+阅读 · 2025年10月1日

【ICML2025】使用树搜索重新排序推理上下文，使大型视觉语言模型更强大

专知会员服务

7+阅读 · 2025年6月10日

【博士论文】学习视觉-语言表示以实现多模态理解

专知会员服务

28+阅读 · 2025年2月8日