对谁而言的常识？印度区域文化常识与大型语言模型的偏见 (Common to Whom? Regional Cultural Commonsense and LLM Bias in India) - 专知论文

会员服务 ·

0

语言模型 · 基准 · 特异 · 大语言模型 · 标注 ·

Common to Whom? Regional Cultural Commonsense and LLM Bias in India

翻译：对谁而言的常识？印度区域文化常识与大型语言模型的偏见

Sangmitra Madhusudan,Trush Shashank More,Steph Buongiorno,Renata Dividino,Jad Kabbara,Ali Emami

Existing cultural commonsense benchmarks treat nations as monolithic, assuming uniform practices within national boundaries. But does cultural commonsense hold uniformly within a nation, or does it vary at the sub-national level? We introduce Indica, the first benchmark designed to test LLMs' ability to address this question, focusing on India - a nation of 28 states, 8 union territories, and 22 official languages. We collect human-annotated answers from five Indian regions (North, South, East, West, and Central) across 515 questions spanning 8 domains of everyday life, yielding 1,630 region-specific question-answer pairs. Strikingly, only 39.4% of questions elicit agreement across all five regions, demonstrating that cultural commonsense in India is predominantly regional, not national. We evaluate eight state-of-the-art LLMs and find two critical gaps: models achieve only 13.4%-20.9% accuracy on region-specific questions, and they exhibit geographic bias, over-selecting Central and North India as the "default" (selected 30-40% more often than expected) while under-representing East and West. Beyond India, our methodology provides a generalizable framework for evaluating cultural commonsense in any culturally heterogeneous nation, from question design grounded in anthropological taxonomy, to regional data collection, to bias measurement.

翻译：现有文化常识基准将国家视为单一整体，假设国家边界内的实践具有统一性。但文化常识是否在一国范围内普遍适用，还是在次国家层面存在差异？我们推出首个旨在检验大型语言模型应对此问题能力的基准——Indica，聚焦于拥有28个邦、8个中央直辖区和22种官方语言的印度。我们收集了来自印度五个区域（北部、南部、东部、西部和中部）人工标注的答案，涵盖日常生活8个领域的515个问题，共获得1,630组区域特异性问答对。引人注目的是，仅39.4%的问题在五个区域获得一致回答，这表明印度的文化常识主要呈现区域性而非全国性特征。我们对八个前沿大型语言模型进行评估，发现两个关键缺陷：模型在区域特异性问题上的准确率仅为13.4%-20.9%，且表现出地理偏见——过度选择中部和北部印度作为“默认”区域（选择频率比预期高30-40%），同时低估东部和西部区域的代表性。超越印度语境，我们的方法论为评估任何文化异质性国家的文化常识提供了可推广的框架，包括基于人类学分类学的问题设计、区域性数据收集以及偏见测量。

0

相关内容

语言模型

大语言模型基准综述

大语言模型基准综述

专知会员服务

25+阅读 · 2025年8月22日

带入您自己的知识：大型语言模型（LLM）知识扩展方法综述

带入您自己的知识：大型语言模型（LLM）知识扩展方法综述

专知会员服务

38+阅读 · 2025年2月21日

【HKUST 博士论文】常识知识表示、推理与应用

【HKUST 博士论文】常识知识表示、推理与应用

专知会员服务

25+阅读 · 2025年2月17日

大模型如何处理事实？西湖大学等最新《大型语言模型中的事实性研究》综述，详述: LLM的知识、检索与领域特异性

大模型如何处理事实？西湖大学等最新《大型语言模型中的事实性研究》综述，详述: LLM的知识、检索与领域特异性

专知会员服务

47+阅读 · 2023年10月12日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

常识如何用？WSDM2021「常识知识」这份教程讲述常识提取、方法与评估，附170页ppt与视频

常识如何用？WSDM2021「常识知识」这份教程讲述常识提取、方法与评估，附170页ppt与视频

专知会员服务

35+阅读 · 2021年3月12日

最新《常识知识图谱概述》综述论文，16页pdf

专知会员服务

32+阅读 · 2020年12月23日

【IJCAI2020】从语言图谱到常识图谱，TransOMCS: From Linguistic Graphs to Commonsense Knowledge

【IJCAI2020】从语言图谱到常识图谱，TransOMCS: From Linguistic Graphs to Commonsense Knowledge

专知会员服务

26+阅读 · 2020年5月6日

【香港科技大学-腾讯】论概念化在常识知识图构建中的作用，Commonsense Knowledge Graph

【香港科技大学-腾讯】论概念化在常识知识图构建中的作用，Commonsense Knowledge Graph

专知会员服务

38+阅读 · 2020年3月9日

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

专知会员服务

16+阅读 · 2019年10月25日

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

专知

91+阅读 · 2020年2月16日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

中文对比英文自然语言处理NLP的区别综述

中文对比英文自然语言处理NLP的区别综述

AINLP

18+阅读 · 2019年3月20日

NLP Chinese Corpus：大规模中文自然语言处理语料

NLP Chinese Corpus：大规模中文自然语言处理语料

PaperWeekly

14+阅读 · 2019年2月18日

技术动态 | TechKG：一个面向中文学术领域的大型知识图谱

技术动态 | TechKG：一个面向中文学术领域的大型知识图谱

开放知识图谱

25+阅读 · 2018年12月20日

神圣的NLP！一文理解词性标注、依存分析和命名实体识别任务

神圣的NLP！一文理解词性标注、依存分析和命名实体识别任务

深度学习与NLP

25+阅读 · 2018年8月22日

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

开放知识图谱

28+阅读 · 2018年6月11日

【论文笔记】基于实体、属性和关系的知识表示学习

【论文笔记】基于实体、属性和关系的知识表示学习

专知

71+阅读 · 2018年5月22日

读书报告 | CN-DBpedia: A Chinese Knowledge Extraction System

读书报告 | CN-DBpedia: A Chinese Knowledge Extraction System

科技创新与创业

19+阅读 · 2018年1月4日

知识图谱 vs. 对话系统专题讨论 - PaperWeekly 社区

知识图谱 vs. 对话系统专题讨论 - PaperWeekly 社区

PaperWeekly

10+阅读 · 2017年10月18日

基于形态和多词的有限语料蒙汉互译调序优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

全球化时代跨界民族国家认同的心理机制研究——以维吾尔族和哈萨克族为例

国家自然科学基金

2+阅读 · 2014年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

藏文化学术语规范化研究

国家自然科学基金

1+阅读 · 2014年12月31日

柬埔寨语命名实体识别及汉柬双语可比语料库构建方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

社会化媒体中基于群体智慧的知识萃取、组织与服务

国家自然科学基金

0+阅读 · 2014年12月31日

建立在文化度量空间上的国家风险分析

国家自然科学基金

3+阅读 · 2014年12月31日

Unmasking the Factual-Conceptual Gap in Persian Language Models

Unmasking the Factual-Conceptual Gap in Persian Language Models

Arxiv

0+阅读 · 2月19日

Bias Beyond Borders: Political Ideology Evaluation and Steering in Multilingual LLMs

Arxiv

0+阅读 · 2月11日

Conceptual Cultural Index: A Metric for Cultural Specificity via Relative Generality

Arxiv

0+阅读 · 2月10日

Bilingual Bias in Large Language Models: A Taiwan Sovereignty Benchmark Study

Arxiv

0+阅读 · 2月6日

No Shortcuts to Culture: Indonesian Multi-hop Question Answering for Complex Cultural Understanding

Arxiv

0+阅读 · 2月3日

Framing Political Bias in Multilingual LLMs Across Pakistani Languages

Arxiv

0+阅读 · 1月30日

Common to Whom? Regional Cultural Commonsense and LLM Bias in India

Arxiv

0+阅读 · 1月28日

Regional Bias in Large Language Models

Arxiv

0+阅读 · 1月22日

A large-scale evaluation of commonsense knowledge in humans and large language models

Arxiv

0+阅读 · 1月21日

One Instruction Does Not Fit All: How Well Do Embeddings Align Personas and Instructions in Low-Resource Indian Languages?

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

大语言模型

相关VIP内容

大语言模型基准综述

大语言模型基准综述

专知会员服务

25+阅读 · 2025年8月22日

带入您自己的知识：大型语言模型（LLM）知识扩展方法综述

带入您自己的知识：大型语言模型（LLM）知识扩展方法综述

专知会员服务

38+阅读 · 2025年2月21日

【HKUST 博士论文】常识知识表示、推理与应用

【HKUST 博士论文】常识知识表示、推理与应用

专知会员服务

25+阅读 · 2025年2月17日

大模型如何处理事实？西湖大学等最新《大型语言模型中的事实性研究》综述，详述: LLM的知识、检索与领域特异性

大模型如何处理事实？西湖大学等最新《大型语言模型中的事实性研究》综述，详述: LLM的知识、检索与领域特异性

专知会员服务

47+阅读 · 2023年10月12日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

常识如何用？WSDM2021「常识知识」这份教程讲述常识提取、方法与评估，附170页ppt与视频

常识如何用？WSDM2021「常识知识」这份教程讲述常识提取、方法与评估，附170页ppt与视频

专知会员服务

35+阅读 · 2021年3月12日

最新《常识知识图谱概述》综述论文，16页pdf

专知会员服务

32+阅读 · 2020年12月23日

【IJCAI2020】从语言图谱到常识图谱，TransOMCS: From Linguistic Graphs to Commonsense Knowledge

【IJCAI2020】从语言图谱到常识图谱，TransOMCS: From Linguistic Graphs to Commonsense Knowledge

专知会员服务

26+阅读 · 2020年5月6日

【香港科技大学-腾讯】论概念化在常识知识图构建中的作用，Commonsense Knowledge Graph

【香港科技大学-腾讯】论概念化在常识知识图构建中的作用，Commonsense Knowledge Graph

专知会员服务

38+阅读 · 2020年3月9日

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

专知会员服务

16+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

专知

91+阅读 · 2020年2月16日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

中文对比英文自然语言处理NLP的区别综述

中文对比英文自然语言处理NLP的区别综述

AINLP

18+阅读 · 2019年3月20日

NLP Chinese Corpus：大规模中文自然语言处理语料

NLP Chinese Corpus：大规模中文自然语言处理语料

PaperWeekly

14+阅读 · 2019年2月18日

技术动态 | TechKG：一个面向中文学术领域的大型知识图谱

技术动态 | TechKG：一个面向中文学术领域的大型知识图谱

开放知识图谱

25+阅读 · 2018年12月20日

神圣的NLP！一文理解词性标注、依存分析和命名实体识别任务

神圣的NLP！一文理解词性标注、依存分析和命名实体识别任务

深度学习与NLP

25+阅读 · 2018年8月22日

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

开放知识图谱

28+阅读 · 2018年6月11日

【论文笔记】基于实体、属性和关系的知识表示学习

【论文笔记】基于实体、属性和关系的知识表示学习

专知

71+阅读 · 2018年5月22日

读书报告 | CN-DBpedia: A Chinese Knowledge Extraction System

读书报告 | CN-DBpedia: A Chinese Knowledge Extraction System

科技创新与创业

19+阅读 · 2018年1月4日

知识图谱 vs. 对话系统专题讨论 - PaperWeekly 社区

知识图谱 vs. 对话系统专题讨论 - PaperWeekly 社区

PaperWeekly

10+阅读 · 2017年10月18日

相关论文

Unmasking the Factual-Conceptual Gap in Persian Language Models

Unmasking the Factual-Conceptual Gap in Persian Language Models

Arxiv

0+阅读 · 2月19日

Bias Beyond Borders: Political Ideology Evaluation and Steering in Multilingual LLMs

Arxiv

0+阅读 · 2月11日

Conceptual Cultural Index: A Metric for Cultural Specificity via Relative Generality

Arxiv

0+阅读 · 2月10日

Bilingual Bias in Large Language Models: A Taiwan Sovereignty Benchmark Study

Arxiv

0+阅读 · 2月6日

No Shortcuts to Culture: Indonesian Multi-hop Question Answering for Complex Cultural Understanding

Arxiv

0+阅读 · 2月3日

Framing Political Bias in Multilingual LLMs Across Pakistani Languages

Arxiv

0+阅读 · 1月30日

Common to Whom? Regional Cultural Commonsense and LLM Bias in India

Arxiv

0+阅读 · 1月28日

Regional Bias in Large Language Models

Arxiv

0+阅读 · 1月22日

A large-scale evaluation of commonsense knowledge in humans and large language models

Arxiv

0+阅读 · 1月21日

One Instruction Does Not Fit All: How Well Do Embeddings Align Personas and Instructions in Low-Resource Indian Languages?

Arxiv

0+阅读 · 1月15日

相关基金

基于形态和多词的有限语料蒙汉互译调序优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

全球化时代跨界民族国家认同的心理机制研究——以维吾尔族和哈萨克族为例

国家自然科学基金

2+阅读 · 2014年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

藏文化学术语规范化研究

国家自然科学基金

1+阅读 · 2014年12月31日

柬埔寨语命名实体识别及汉柬双语可比语料库构建方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

社会化媒体中基于群体智慧的知识萃取、组织与服务

国家自然科学基金

0+阅读 · 2014年12月31日

建立在文化度量空间上的国家风险分析

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员