Decoding Market Emotions in Cryptocurrency Tweets via Predictive Statement Classification with Machine Learning and Transformers - 专知论文

会员服务 ·

0

加密货币 · 类别 · Transformer · 识别 · 标注 ·

Decoding Market Emotions in Cryptocurrency Tweets via Predictive Statement Classification with Machine Learning and Transformers

翻译：加密货币推文中市场情绪的解读：基于机器学习与Transformer的预测性陈述分类

Moein Shahiki Tash,Zahra Ahani,Mohim Tash,Mostafa Keikhay Farzaneh,Ari Y. Barrera-Animas,Olga Kolesnikova

The growing prominence of cryptocurrencies has triggered widespread public engagement and increased speculative activity, particularly on social media platforms. This study introduces a novel classification framework for identifying predictive statements in cryptocurrency-related tweets, focusing on five popular cryptocurrencies: Cardano, Matic, Binance, Ripple, and Fantom. The classification process is divided into two stages: Task 1 involves binary classification to distinguish between Predictive and Non-Predictive statements. Tweets identified as Predictive proceed to Task 2, where they are further categorized as Incremental, Decremental, or Neutral. To build a robust dataset, we combined manual and GPT-based annotation methods and utilized SenticNet to extract emotion features corresponding to each prediction category. To address class imbalance, GPT-generated paraphrasing was employed for data augmentation. We evaluated a wide range of machine learning, deep learning, and transformer-based models across both tasks. The results show that GPT-based balancing significantly enhanced model performance, with transformer models achieving the highest F1-score in Task 1, while traditional machine learning models performed best in Task 2. Furthermore, our emotion analysis revealed distinct emotional patterns associated with each prediction category across the different cryptocurrencies.

翻译：加密货币的日益兴起引发了广泛的公众参与和投机活动的增加，尤其在社交媒体平台上尤为显著。本研究提出了一种新颖的分类框架，用于识别加密货币相关推文中的预测性陈述，聚焦于五种热门加密货币：Cardano、Matic、Binance、Ripple和Fantom。分类过程分为两个阶段：任务1涉及二分类，区分预测性陈述与非预测性陈述。被识别为预测性的推文进入任务2，进一步划分为增量、减量或中性三类。为构建稳健的数据集，我们结合了人工标注和基于GPT的标注方法，并利用SenticNet提取与每种预测类别对应的情感特征。为解决类别不平衡问题，采用GPT生成的改述进行数据增强。我们在两个任务中评估了广泛的机器学习、深度学习及基于Transformer的模型。结果表明，基于GPT的平衡处理显著提升了模型性能：Transformer模型在任务1中获得了最高的F1分数，而传统机器学习模型在任务2中表现最佳。此外，我们的情感分析揭示了不同加密货币中每种预测类别所关联的独特情感模式。

0

相关内容

加密货币

推荐！《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】北约科技组织20余位作者2022最新126页技术报告

推荐！《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】北约科技组织20余位作者2022最新126页技术报告

专知会员服务

88+阅读 · 2022年10月26日

推荐！【区块链+军事】译文《区块链：北约后勤能力的转型》附论文+PPT，2022年北约“评估新兴技术对军事后勤的影响”研讨会

推荐！【区块链+军事】译文《区块链：北约后勤能力的转型》附论文+PPT，2022年北约“评估新兴技术对军事后勤的影响”研讨会

专知会员服务

87+阅读 · 2022年9月14日

【干货书】John Wiley & Sons, Inc. 《Blockchain For Dummies（区块链傻瓜书），237页pdf

【干货书】John Wiley & Sons, Inc. 《Blockchain For Dummies（区块链傻瓜书），237页pdf

专知会员服务

36+阅读 · 2022年2月22日

2021年中国区块链行业发展白皮书，63页pdf

2021年中国区块链行业发展白皮书，63页pdf

专知会员服务

70+阅读 · 2021年10月27日

区块链基础设施研究报告（2021年），30页pdf

专知会员服务

34+阅读 · 2021年7月29日

区块链+数字经济发展白皮书，45页pdf

区块链+数字经济发展白皮书，45页pdf

专知会员服务

135+阅读 · 2021年4月25日

区块链技术前沿报告，32页pdf

专知会员服务

121+阅读 · 2021年3月11日

基于区块链的数字货币发展现状与展望

专知会员服务

31+阅读 · 2021年3月7日

区块链技术原理与应用综述

专知会员服务

96+阅读 · 2021年2月24日

资源|Blockchain区块链中文资源阅读列表

资源|Blockchain区块链中文资源阅读列表

专知会员服务

44+阅读 · 2019年11月20日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

【资源】Blockchain 区块链中文资源阅读列表

【资源】Blockchain 区块链中文资源阅读列表

专知

20+阅读 · 2019年11月3日

Github项目推荐 | 股市预测的机器学习/深度学习模型/资源集锦

Github项目推荐 | 股市预测的机器学习/深度学习模型/资源集锦

AI研习社

33+阅读 · 2019年4月18日

当区块链与人工智能相遇，会有怎样火花？这篇23页《Blockchain for AI》综述论文告诉你（附下载）

当区块链与人工智能相遇，会有怎样火花？这篇23页《Blockchain for AI》综述论文告诉你（附下载）

专知

18+阅读 · 2019年1月20日

深度学习在金融文本情感分类中的应用

深度学习在金融文本情感分类中的应用

AI前线

36+阅读 · 2019年1月12日

区块链隐私保护研究综述——祝烈煌详解

区块链隐私保护研究综述——祝烈煌详解

计算机研究与发展

23+阅读 · 2018年11月28日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

13+阅读 · 2018年8月15日

(Python)时序预测的七种方法

(Python)时序预测的七种方法

云栖社区

10+阅读 · 2018年2月25日

用深度学习预测比特币价格

用深度学习预测比特币价格

Python程序员

11+阅读 · 2017年12月23日

【区块链】图解区块链：14张图看懂什么是“区块链技术”？黑科技区块链如何来建设“智慧城市”

【区块链】图解区块链：14张图看懂什么是“区块链技术”？黑科技区块链如何来建设“智慧城市”

产业智能官

13+阅读 · 2017年8月26日

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于特征提取与分层建模的社交网络信息传播预测研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

社交网络中的流言传播与演化

国家自然科学基金

2+阅读 · 2015年12月31日

社交网络中消费者行为演化及引导机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入网络平台投资者情绪的证券市场风险生成机制及传染效应研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

谱聚类在多个网络模块识别中的推广及在生物网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

ForesightFlow: An Information Leakage Score Framework for Prediction Markets

Arxiv

0+阅读 · 5月1日

Capturing Monetarily Exploitable Vulnerability in Smart Contracts via Auditor Knowledge-Learning Fuzzing

Arxiv

0+阅读 · 4月20日

Decoding RWA Tokenized U.S. Treasuries: Functional Dissection and Address Role Inference

Arxiv

0+阅读 · 4月20日

The Hidden Plumbing of Stablecoins: Financial and Technological Risks in the GENIUS Act Era

Arxiv

0+阅读 · 4月18日

What Happens When Institutional Liquidity Enters Prediction Markets: Identification, Measurement, and a Synthetic Proof of Concept

Arxiv

0+阅读 · 4月17日

Synthetic data in cryptocurrencies using generative models

Arxiv

0+阅读 · 4月17日

What Happens When Institutional Liquidity Enters Prediction Markets: Identification, Measurement, and a Synthetic Proof of Concept

Arxiv

0+阅读 · 4月11日

Decoding RWA Tokenized U.S. Treasuries: Functional Dissection and Address Role Inference

Arxiv

0+阅读 · 4月3日

Tiered Super-Moore's Law: Price Evolution, Production Frontiers, and Market Competition in Large Language Model Inference Services

Arxiv

0+阅读 · 3月30日

Stablecoins as Dry Powder: A Copula-Based Risk Analysis of Cryptocurrency Markets

Arxiv

0+阅读 · 3月24日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

6+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

2+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

2+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

13+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

12+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

12+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

8+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

13+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

9+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

22+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

11+阅读 · 6月17日

相关VIP内容

推荐！《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】北约科技组织20余位作者2022最新126页技术报告

推荐！《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】北约科技组织20余位作者2022最新126页技术报告

专知会员服务

88+阅读 · 2022年10月26日

推荐！【区块链+军事】译文《区块链：北约后勤能力的转型》附论文+PPT，2022年北约“评估新兴技术对军事后勤的影响”研讨会

推荐！【区块链+军事】译文《区块链：北约后勤能力的转型》附论文+PPT，2022年北约“评估新兴技术对军事后勤的影响”研讨会

专知会员服务

87+阅读 · 2022年9月14日

【干货书】John Wiley & Sons, Inc. 《Blockchain For Dummies（区块链傻瓜书），237页pdf

【干货书】John Wiley & Sons, Inc. 《Blockchain For Dummies（区块链傻瓜书），237页pdf

专知会员服务

36+阅读 · 2022年2月22日

2021年中国区块链行业发展白皮书，63页pdf

2021年中国区块链行业发展白皮书，63页pdf

专知会员服务

70+阅读 · 2021年10月27日

区块链基础设施研究报告（2021年），30页pdf

专知会员服务

34+阅读 · 2021年7月29日

区块链+数字经济发展白皮书，45页pdf

区块链+数字经济发展白皮书，45页pdf

专知会员服务

135+阅读 · 2021年4月25日

区块链技术前沿报告，32页pdf

专知会员服务

121+阅读 · 2021年3月11日

基于区块链的数字货币发展现状与展望

专知会员服务

31+阅读 · 2021年3月7日

区块链技术原理与应用综述

专知会员服务

96+阅读 · 2021年2月24日

资源|Blockchain区块链中文资源阅读列表

资源|Blockchain区块链中文资源阅读列表

专知会员服务

44+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

【资源】Blockchain 区块链中文资源阅读列表

【资源】Blockchain 区块链中文资源阅读列表

专知

20+阅读 · 2019年11月3日

Github项目推荐 | 股市预测的机器学习/深度学习模型/资源集锦

Github项目推荐 | 股市预测的机器学习/深度学习模型/资源集锦

AI研习社

33+阅读 · 2019年4月18日

当区块链与人工智能相遇，会有怎样火花？这篇23页《Blockchain for AI》综述论文告诉你（附下载）

当区块链与人工智能相遇，会有怎样火花？这篇23页《Blockchain for AI》综述论文告诉你（附下载）

专知

18+阅读 · 2019年1月20日

深度学习在金融文本情感分类中的应用

深度学习在金融文本情感分类中的应用

AI前线

36+阅读 · 2019年1月12日

区块链隐私保护研究综述——祝烈煌详解

区块链隐私保护研究综述——祝烈煌详解

计算机研究与发展

23+阅读 · 2018年11月28日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

13+阅读 · 2018年8月15日

(Python)时序预测的七种方法

(Python)时序预测的七种方法

云栖社区

10+阅读 · 2018年2月25日

用深度学习预测比特币价格

用深度学习预测比特币价格

Python程序员

11+阅读 · 2017年12月23日

【区块链】图解区块链：14张图看懂什么是“区块链技术”？黑科技区块链如何来建设“智慧城市”

【区块链】图解区块链：14张图看懂什么是“区块链技术”？黑科技区块链如何来建设“智慧城市”

产业智能官

13+阅读 · 2017年8月26日

相关论文

ForesightFlow: An Information Leakage Score Framework for Prediction Markets

Arxiv

0+阅读 · 5月1日

Capturing Monetarily Exploitable Vulnerability in Smart Contracts via Auditor Knowledge-Learning Fuzzing

Arxiv

0+阅读 · 4月20日

Decoding RWA Tokenized U.S. Treasuries: Functional Dissection and Address Role Inference

Arxiv

0+阅读 · 4月20日

The Hidden Plumbing of Stablecoins: Financial and Technological Risks in the GENIUS Act Era

Arxiv

0+阅读 · 4月18日

What Happens When Institutional Liquidity Enters Prediction Markets: Identification, Measurement, and a Synthetic Proof of Concept

Arxiv

0+阅读 · 4月17日

Synthetic data in cryptocurrencies using generative models

Arxiv

0+阅读 · 4月17日

What Happens When Institutional Liquidity Enters Prediction Markets: Identification, Measurement, and a Synthetic Proof of Concept

Arxiv

0+阅读 · 4月11日

Decoding RWA Tokenized U.S. Treasuries: Functional Dissection and Address Role Inference

Arxiv

0+阅读 · 4月3日

Tiered Super-Moore's Law: Price Evolution, Production Frontiers, and Market Competition in Large Language Model Inference Services

Arxiv

0+阅读 · 3月30日

Stablecoins as Dry Powder: A Copula-Based Risk Analysis of Cryptocurrency Markets

Arxiv

0+阅读 · 3月24日

相关基金

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于特征提取与分层建模的社交网络信息传播预测研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于反射理论的信息驱动金融市场模型研究

国家自然科学基金

2+阅读 · 2015年12月31日

社交网络中的流言传播与演化

国家自然科学基金

2+阅读 · 2015年12月31日

社交网络中消费者行为演化及引导机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入网络平台投资者情绪的证券市场风险生成机制及传染效应研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

谱聚类在多个网络模块识别中的推广及在生物网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员