Greenwashing refers to practices by corporations or governments that intentionally mislead the public about their environmental impact. This paper provides a comprehensive and methodologically grounded survey of natural language processing (NLP) approaches for detecting greenwashing in textual data, with a focus on corporate climate communication. Rather than treating greenwashing as a single, monolithic task, we examine the set of NLP problems, also known as climate NLP tasks, that researchers have used to approximate it, ranging from climate topic detection to the identification of deceptive communication patterns. Our focus is on the methodological foundations of these approaches: how tasks are formulated, how datasets are constructed, and how model evaluation influences reliability. Our review reveals a fragmented landscape: several subtasks now exhibit near-perfect performance under controlled settings, yet tasks involving ambiguity, subjectivity, or reasoning remain challenging. Crucially, no dataset of verified greenwashing cases currently exists. We argue that advancing automated greenwashing detection requires principled NLP methodologies that combine reliable data annotations with interpretable model design. Future work should leverage third-party judgments, such as verified media reports or regulatory records, to mitigate annotation subjectivity and legal risk, and adopt decomposed pipelines that support human oversight, traceable reasoning, and efficient model design.


翻译:绿色漂洗指企业或政府机构在环境影响方面故意误导公众的行为。本文对基于文本数据的绿色漂洗检测自然语言处理方法进行了系统且方法学基础扎实的综述,重点关注企业气候传播领域。我们并非将绿色漂洗视为单一整体任务,而是系统考察了研究者用以近似该目标的一系列自然语言处理问题(亦称气候自然语言处理任务),涵盖从气候主题检测到欺骗性传播模式识别的多个层面。本文聚焦于这些方法的方法学基础:任务如何形式化、数据集如何构建、模型评估如何影响结果可靠性。综述发现该领域呈现碎片化态势:若干子任务在受控环境下已接近完美性能,但涉及模糊性、主观性或推理能力的任务仍具挑战性。关键问题在于目前缺乏经过核实的绿色漂洗案例数据集。我们认为推进自动化绿色漂洗检测需要建立规范的自然语言处理方法论,将可靠的数据标注与可解释的模型设计相结合。未来研究应利用第三方判断(如经核实的媒体报道或监管记录)来降低标注主观性与法律风险,并采用支持人工监督、可追溯推理及高效模型设计的模块化流程。

0
下载
关闭预览

相关内容

自然语言处理中的文本表示研究
专知会员服务
58+阅读 · 2022年1月10日
专知会员服务
19+阅读 · 2021年7月18日
专知会员服务
81+阅读 · 2021年5月30日
最新《自然场景中文本检测与识别》综述论文,26页pdf
专知会员服务
70+阅读 · 2020年6月10日
【自然语言处理】清华刘知远55页自然语言处理PPT
产业智能官
19+阅读 · 2019年8月23日
一文看懂自然语言理解(NLU)
AINLP
26+阅读 · 2019年4月27日
从语言学到深度学习NLP,一文概述自然语言处理
人工智能学家
13+阅读 · 2018年1月28日
【NLP】十分钟快览自然语言处理学习总结
专知
17+阅读 · 2017年11月21日
TextInfoExp:自然语言处理相关实验(基于sougou数据集)
全球人工智能
12+阅读 · 2017年11月12日
Natural 自然语言处理(NLP)「全解析」
人工智能学家
14+阅读 · 2017年9月23日
NLP(自然语言处理)扫盲
大数据和云计算技术
20+阅读 · 2017年7月9日
自然语言处理 (三) 之 word embedding
DeepLearning中文论坛
19+阅读 · 2015年8月3日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月13日
Arxiv
83+阅读 · 2023年3月26日
VIP会员
相关资讯
【自然语言处理】清华刘知远55页自然语言处理PPT
产业智能官
19+阅读 · 2019年8月23日
一文看懂自然语言理解(NLU)
AINLP
26+阅读 · 2019年4月27日
从语言学到深度学习NLP,一文概述自然语言处理
人工智能学家
13+阅读 · 2018年1月28日
【NLP】十分钟快览自然语言处理学习总结
专知
17+阅读 · 2017年11月21日
TextInfoExp:自然语言处理相关实验(基于sougou数据集)
全球人工智能
12+阅读 · 2017年11月12日
Natural 自然语言处理(NLP)「全解析」
人工智能学家
14+阅读 · 2017年9月23日
NLP(自然语言处理)扫盲
大数据和云计算技术
20+阅读 · 2017年7月9日
自然语言处理 (三) 之 word embedding
DeepLearning中文论坛
19+阅读 · 2015年8月3日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员