The growing prominence of cryptocurrencies has triggered widespread public engagement and increased speculative activity, particularly on social media platforms. This study introduces a novel classification framework for identifying predictive statements in cryptocurrency-related tweets, focusing on five popular cryptocurrencies: Cardano, Matic, Binance, Ripple, and Fantom. The classification process is divided into two stages: Task 1 involves binary classification to distinguish between Predictive and Non-Predictive statements. Tweets identified as Predictive proceed to Task 2, where they are further categorized as Incremental, Decremental, or Neutral. To build a robust dataset, we combined manual and GPT-based annotation methods and utilized SenticNet to extract emotion features corresponding to each prediction category. To address class imbalance, GPT-generated paraphrasing was employed for data augmentation. We evaluated a wide range of machine learning, deep learning, and transformer-based models across both tasks. The results show that GPT-based balancing significantly enhanced model performance, with transformer models achieving the highest F1-score in Task 1, while traditional machine learning models performed best in Task 2. Furthermore, our emotion analysis revealed distinct emotional patterns associated with each prediction category across the different cryptocurrencies.


翻译:加密货币的日益兴起引发了广泛的公众参与和投机活动的增加,尤其在社交媒体平台上尤为显著。本研究提出了一种新颖的分类框架,用于识别加密货币相关推文中的预测性陈述,聚焦于五种热门加密货币:Cardano、Matic、Binance、Ripple和Fantom。分类过程分为两个阶段:任务1涉及二分类,区分预测性陈述与非预测性陈述。被识别为预测性的推文进入任务2,进一步划分为增量、减量或中性三类。为构建稳健的数据集,我们结合了人工标注和基于GPT的标注方法,并利用SenticNet提取与每种预测类别对应的情感特征。为解决类别不平衡问题,采用GPT生成的改述进行数据增强。我们在两个任务中评估了广泛的机器学习、深度学习及基于Transformer的模型。结果表明,基于GPT的平衡处理显著提升了模型性能:Transformer模型在任务1中获得了最高的F1分数,而传统机器学习模型在任务2中表现最佳。此外,我们的情感分析揭示了不同加密货币中每种预测类别所关联的独特情感模式。

0
下载
关闭预览

相关内容

2021年中国区块链行业发展白皮书,63页pdf
专知会员服务
70+阅读 · 2021年10月27日
专知会员服务
34+阅读 · 2021年7月29日
区块链+数字经济发展白皮书,45页pdf
专知会员服务
135+阅读 · 2021年4月25日
专知会员服务
121+阅读 · 2021年3月11日
专知会员服务
31+阅读 · 2021年3月7日
专知会员服务
96+阅读 · 2021年2月24日
资源|Blockchain区块链中文资源阅读列表
专知会员服务
44+阅读 · 2019年11月20日
【资源】Blockchain 区块链中文资源阅读列表
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
区块链隐私保护研究综述——祝烈煌详解
计算机研究与发展
23+阅读 · 2018年11月28日
(Python)时序预测的七种方法
云栖社区
10+阅读 · 2018年2月25日
用深度学习预测比特币价格
Python程序员
11+阅读 · 2017年12月23日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
6+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
2+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
9+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
11+阅读 · 6月17日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员