Launchpads have become the dominant mechanism for issuing memecoins on blockchains due to their fully automated, no-code creation process. This new issuance paradigm has led to a surge in high-risk token launches, causing substantial financial losses for unsuspecting buyers. In this paper, we introduce MemeTrans, the first dataset for studying and detecting high-risk memecoin launches on Solana. MemeTrans covers over 40k memecoin launches that successfully migrated to the public Decentralized Exchange (DEX), with over 30 million transactions during the initial sale on launchpad and 180 million transactions after migration. To precisely capture launch patterns, we design 122 features spanning dimensions such as context, trading activity, holding concentration, and time-series dynamics, supplemented with bundle-level data that reveals multiple accounts controlled by the same entity. Finally, we introduce an annotation approach to label the risk level of memecoin launches, which combines statistical indicators with a manipulation-pattern detector. Experiments on the introduced high-risk launch detection task suggest that designed features are informative for capturing high-risk patterns and ML models trained on MemeTrans can effectively reduce financial loss by 56.1%. Our dataset, experimental code, and pipeline are publicly available at: https://github.com/git-disl/MemeTrans.


翻译:由于启动平台提供完全自动化、无需编码的创建流程,其已成为区块链上发行模因币的主导机制。这种新型发行范式导致了高风险代币发行的激增,给毫无戒心的买家造成了重大财务损失。本文介绍了MemeTrans,这是首个用于研究和检测Solana上高风险模因币发行的数据集。MemeTrans覆盖了超过4万次成功迁移至公共去中心化交易所(DEX)的模因币发行事件,包含启动平台初始销售期间的超过3000万笔交易以及迁移后的1.8亿笔交易。为精确捕捉发行模式,我们设计了涵盖上下文、交易活动、持仓集中度和时间序列动态等维度的122个特征,并辅以揭示同一实体控制的多个账户的捆绑级数据。最后,我们提出了一种结合统计指标与操纵模式检测器的标注方法,用于标记模因币发行的风险等级。在引入的高风险发行检测任务上的实验表明,所设计的特征能有效捕捉高风险模式,基于MemeTrans训练的机器学习模型可将财务损失降低56.1%。我们的数据集、实验代码与处理流程已公开于:https://github.com/git-disl/MemeTrans。

0
下载
关闭预览

相关内容

数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。
Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。
《MERLIN:面向推广资源与研究的国家数据管理平台》报告
专知会员服务
15+阅读 · 2025年12月27日
一种Agent自主性风险评估框架 | 最新文献
专知会员服务
19+阅读 · 2025年10月24日
EMNLP 2023 | MeaeQ: 通过高效查询执行模型窃取攻击
专知会员服务
18+阅读 · 2023年12月9日
【MES】可能是史上最详细的MES介绍
产业智能官
16+阅读 · 2020年6月22日
【大数据】StreamSets:一个大数据采集工具
产业智能官
40+阅读 · 2018年12月5日
腾讯:机器学习构建通用的数据异常检测平台
全球人工智能
11+阅读 · 2018年5月1日
用深度学习预测比特币价格
Python程序员
11+阅读 · 2017年12月23日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
《MERLIN:面向推广资源与研究的国家数据管理平台》报告
专知会员服务
15+阅读 · 2025年12月27日
一种Agent自主性风险评估框架 | 最新文献
专知会员服务
19+阅读 · 2025年10月24日
EMNLP 2023 | MeaeQ: 通过高效查询执行模型窃取攻击
专知会员服务
18+阅读 · 2023年12月9日
相关基金
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员