Detecting Greenwashing: A Natural Language Processing Literature Survey - 专知论文

会员服务 ·

0

语言处理 · 自然语言处理 · 综述 · 系统 · 标注 ·

Detecting Greenwashing: A Natural Language Processing Literature Survey

翻译：绿色漂洗检测：自然语言处理文献综述

Tom Calamai,Oana Balalau,Théo Le Guenedal,Fabian M. Suchanek

from arxiv, 42 pages, 1 figure, 11 pages (appendix), working paper

Greenwashing refers to practices by corporations or governments that intentionally mislead the public about their environmental impact. This paper provides a comprehensive and methodologically grounded survey of natural language processing (NLP) approaches for detecting greenwashing in textual data, with a focus on corporate climate communication. Rather than treating greenwashing as a single, monolithic task, we examine the set of NLP problems, also known as climate NLP tasks, that researchers have used to approximate it, ranging from climate topic detection to the identification of deceptive communication patterns. Our focus is on the methodological foundations of these approaches: how tasks are formulated, how datasets are constructed, and how model evaluation influences reliability. Our review reveals a fragmented landscape: several subtasks now exhibit near-perfect performance under controlled settings, yet tasks involving ambiguity, subjectivity, or reasoning remain challenging. Crucially, no dataset of verified greenwashing cases currently exists. We argue that advancing automated greenwashing detection requires principled NLP methodologies that combine reliable data annotations with interpretable model design. Future work should leverage third-party judgments, such as verified media reports or regulatory records, to mitigate annotation subjectivity and legal risk, and adopt decomposed pipelines that support human oversight, traceable reasoning, and efficient model design.

翻译：绿色漂洗指企业或政府机构在环境影响方面故意误导公众的行为。本文对基于文本数据的绿色漂洗检测自然语言处理方法进行了系统且方法学基础扎实的综述，重点关注企业气候传播领域。我们并非将绿色漂洗视为单一整体任务，而是系统考察了研究者用以近似该目标的一系列自然语言处理问题（亦称气候自然语言处理任务），涵盖从气候主题检测到欺骗性传播模式识别的多个层面。本文聚焦于这些方法的方法学基础：任务如何形式化、数据集如何构建、模型评估如何影响结果可靠性。综述发现该领域呈现碎片化态势：若干子任务在受控环境下已接近完美性能，但涉及模糊性、主观性或推理能力的任务仍具挑战性。关键问题在于目前缺乏经过核实的绿色漂洗案例数据集。我们认为推进自动化绿色漂洗检测需要建立规范的自然语言处理方法论，将可靠的数据标注与可解释的模型设计相结合。未来研究应利用第三方判断（如经核实的媒体报道或监管记录）来降低标注主观性与法律风险，并采用支持人工监督、可追溯推理及高效模型设计的模块化流程。

0

相关内容

语言处理

【俄亥俄州立大学学生论文】鲁棒自然语言理解，74页pdf，Towards More Robust Natural Language Understanding

【俄亥俄州立大学学生论文】鲁棒自然语言理解，74页pdf，Towards More Robust Natural Language Understanding

专知会员服务

19+阅读 · 2022年3月1日

自然语言处理中的文本表示研究

自然语言处理中的文本表示研究

专知会员服务

58+阅读 · 2022年1月10日

自然语言处理评测中的问题与对策

专知会员服务

19+阅读 · 2021年7月18日

可解释的自然语言处理方法简介

专知会员服务

81+阅读 · 2021年5月30日

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

专知会员服务

140+阅读 · 2020年7月10日

【文献综述】Text Detection and Recognition in the Wild: A Review 自然文本检测与识别

【文献综述】Text Detection and Recognition in the Wild: A Review 自然文本检测与识别

专知会员服务

46+阅读 · 2020年6月11日

最新《自然场景中文本检测与识别》综述论文，26页pdf

最新《自然场景中文本检测与识别》综述论文，26页pdf

专知会员服务

70+阅读 · 2020年6月10日

【论文推荐】自然语言处理与查询扩展综述，Natural Language Processing and Query Expansion

【论文推荐】自然语言处理与查询扩展综述，Natural Language Processing and Query Expansion

专知会员服务

44+阅读 · 2020年5月3日

深度学习自然语言处理综述论文，Natural Language Processing Advancements By Deep Learning: A Survey

深度学习自然语言处理综述论文，Natural Language Processing Advancements By Deep Learning: A Survey

专知会员服务

80+阅读 · 2020年3月5日

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

专知会员服务

79+阅读 · 2020年2月12日

【自然语言处理】清华刘知远55页自然语言处理PPT

【自然语言处理】清华刘知远55页自然语言处理PPT

产业智能官

19+阅读 · 2019年8月23日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

一文看懂自然语言理解（NLU）

一文看懂自然语言理解（NLU）

AINLP

26+阅读 · 2019年4月27日

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

机器之心

13+阅读 · 2018年6月3日

从语言学到深度学习NLP，一文概述自然语言处理

从语言学到深度学习NLP，一文概述自然语言处理

人工智能学家

13+阅读 · 2018年1月28日

【NLP】十分钟快览自然语言处理学习总结

【NLP】十分钟快览自然语言处理学习总结

专知

17+阅读 · 2017年11月21日

TextInfoExp:自然语言处理相关实验（基于sougou数据集）

TextInfoExp:自然语言处理相关实验（基于sougou数据集）

全球人工智能

12+阅读 · 2017年11月12日

Natural 自然语言处理（NLP）「全解析」

Natural 自然语言处理（NLP）「全解析」

人工智能学家

14+阅读 · 2017年9月23日

NLP（自然语言处理）扫盲

NLP（自然语言处理）扫盲

大数据和云计算技术

20+阅读 · 2017年7月9日

自然语言处理 (三)　之　word embedding

自然语言处理 (三)　之　word embedding

DeepLearning中文论坛

19+阅读 · 2015年8月3日

基于可磁分离时间分辨荧光传感体系的持久性有机污染物检测技术及机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于微生物图像识别的水质监测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

“自然语言-草图”耦合的地理场景查询方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

水生植物形态变化对泥水界面破坏及污染物释放的水动力学影响

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉上下文与文字显著性的复杂自然场景中文字检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

沉水植物诱导绿藻群体形成机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于生态系统服务价值的非点源污染控制措施评价与优选方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于景观空间异质性的绿地综合生态服务功能评价研究

国家自然科学基金

0+阅读 · 2015年12月31日

典型来源腐殖酸不同光敏结构的分离与识别及对水中持久性有毒物质光解的影响机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向二类水体叶绿素a浓度遥感反演的光谱纯化研究

国家自然科学基金

0+阅读 · 2014年12月31日

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

Arxiv

0+阅读 · 2月18日

DependencyAI: Detecting AI Generated Text through Dependency Parsing

Arxiv

0+阅读 · 2月17日

Foundations and Evaluations in NLP

Arxiv

0+阅读 · 2月13日

Cross-lingual Offensive Language Detection: A Systematic Review of Datasets, Transfer Approaches and Challenges

Arxiv

0+阅读 · 2月12日

DeepGreen: Effective LLM-Driven Greenwashing Monitoring System Designed for Empirical Testing -- Evidence from China

Arxiv

0+阅读 · 1月30日

Enhancing Language Models for Robust Greenwashing Detection

Arxiv

0+阅读 · 1月29日

When Benchmarks Leak: Inference-Time Decontamination for LLMs

Arxiv

0+阅读 · 1月27日

SciNUP: Natural Language User Interest Profiles for Scientific Literature Recommendation

Arxiv

0+阅读 · 1月23日

From Noise to Signal to Selbstzweck: Reframing Human Label Variation in the Era of Post-training in NLP

Arxiv

0+阅读 · 1月16日

Nature Language Reasoning, A Survey

Arxiv

83+阅读 · 2023年3月26日

VIP会员

文章信息

相关主题

自然语言处理

最新内容

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

11+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

相关VIP内容

【俄亥俄州立大学学生论文】鲁棒自然语言理解，74页pdf，Towards More Robust Natural Language Understanding

【俄亥俄州立大学学生论文】鲁棒自然语言理解，74页pdf，Towards More Robust Natural Language Understanding

专知会员服务

19+阅读 · 2022年3月1日

自然语言处理中的文本表示研究

自然语言处理中的文本表示研究

专知会员服务

58+阅读 · 2022年1月10日

自然语言处理评测中的问题与对策

专知会员服务

19+阅读 · 2021年7月18日

可解释的自然语言处理方法简介

专知会员服务

81+阅读 · 2021年5月30日

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

专知会员服务

140+阅读 · 2020年7月10日

【文献综述】Text Detection and Recognition in the Wild: A Review 自然文本检测与识别

【文献综述】Text Detection and Recognition in the Wild: A Review 自然文本检测与识别

专知会员服务

46+阅读 · 2020年6月11日

最新《自然场景中文本检测与识别》综述论文，26页pdf

最新《自然场景中文本检测与识别》综述论文，26页pdf

专知会员服务

70+阅读 · 2020年6月10日

【论文推荐】自然语言处理与查询扩展综述，Natural Language Processing and Query Expansion

【论文推荐】自然语言处理与查询扩展综述，Natural Language Processing and Query Expansion

专知会员服务

44+阅读 · 2020年5月3日

深度学习自然语言处理综述论文，Natural Language Processing Advancements By Deep Learning: A Survey

深度学习自然语言处理综述论文，Natural Language Processing Advancements By Deep Learning: A Survey

专知会员服务

80+阅读 · 2020年3月5日

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

专知会员服务

79+阅读 · 2020年2月12日

热门VIP内容

开通专知VIP会员享更多权益服务

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

相关资讯

【自然语言处理】清华刘知远55页自然语言处理PPT

【自然语言处理】清华刘知远55页自然语言处理PPT

产业智能官

19+阅读 · 2019年8月23日

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

清华大学刘知远《知识指导的自然语言处理》，附55页PPT下载

专知

36+阅读 · 2019年7月7日

一文看懂自然语言理解（NLU）

一文看懂自然语言理解（NLU）

AINLP

26+阅读 · 2019年4月27日

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

机器之心

13+阅读 · 2018年6月3日

从语言学到深度学习NLP，一文概述自然语言处理

从语言学到深度学习NLP，一文概述自然语言处理

人工智能学家

13+阅读 · 2018年1月28日

【NLP】十分钟快览自然语言处理学习总结

【NLP】十分钟快览自然语言处理学习总结

专知

17+阅读 · 2017年11月21日

TextInfoExp:自然语言处理相关实验（基于sougou数据集）

TextInfoExp:自然语言处理相关实验（基于sougou数据集）

全球人工智能

12+阅读 · 2017年11月12日

Natural 自然语言处理（NLP）「全解析」

Natural 自然语言处理（NLP）「全解析」

人工智能学家

14+阅读 · 2017年9月23日

NLP（自然语言处理）扫盲

NLP（自然语言处理）扫盲

大数据和云计算技术

20+阅读 · 2017年7月9日

自然语言处理 (三)　之　word embedding

自然语言处理 (三)　之　word embedding

DeepLearning中文论坛

19+阅读 · 2015年8月3日

相关论文

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

Arxiv

0+阅读 · 2月18日

DependencyAI: Detecting AI Generated Text through Dependency Parsing

Arxiv

0+阅读 · 2月17日

Foundations and Evaluations in NLP

Arxiv

0+阅读 · 2月13日

Cross-lingual Offensive Language Detection: A Systematic Review of Datasets, Transfer Approaches and Challenges

Arxiv

0+阅读 · 2月12日

DeepGreen: Effective LLM-Driven Greenwashing Monitoring System Designed for Empirical Testing -- Evidence from China

Arxiv

0+阅读 · 1月30日

Enhancing Language Models for Robust Greenwashing Detection

Arxiv

0+阅读 · 1月29日

When Benchmarks Leak: Inference-Time Decontamination for LLMs

Arxiv

0+阅读 · 1月27日

SciNUP: Natural Language User Interest Profiles for Scientific Literature Recommendation

Arxiv

0+阅读 · 1月23日

From Noise to Signal to Selbstzweck: Reframing Human Label Variation in the Era of Post-training in NLP

Arxiv

0+阅读 · 1月16日

Nature Language Reasoning, A Survey

Arxiv

83+阅读 · 2023年3月26日

相关基金

基于可磁分离时间分辨荧光传感体系的持久性有机污染物检测技术及机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于微生物图像识别的水质监测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

“自然语言-草图”耦合的地理场景查询方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

水生植物形态变化对泥水界面破坏及污染物释放的水动力学影响

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉上下文与文字显著性的复杂自然场景中文字检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

沉水植物诱导绿藻群体形成机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于生态系统服务价值的非点源污染控制措施评价与优选方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于景观空间异质性的绿地综合生态服务功能评价研究

国家自然科学基金

0+阅读 · 2015年12月31日

典型来源腐殖酸不同光敏结构的分离与识别及对水中持久性有毒物质光解的影响机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向二类水体叶绿素a浓度遥感反演的光谱纯化研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员