The rapid growth of digital commerce has led to the accumulation of a massive number of consumer reviews on online platforms. Shopee, as one of the largest e-commerce platforms in Southeast Asia, receives millions of product reviews every day containing valuable information regarding customer satisfaction and preferences. Manual analysis of these reviews is inefficient, thus requiring a computational approach such as sentiment analysis. This study examines the use of DistilBERT, a lightweight transformer-based deep learning model, for sentiment classification on Shopee product reviews. The dataset used consists of approximately one million English-language reviews that have been preprocessed and trained using the distilbert-base-uncased model. Evaluation was conducted using accuracy, precision, recall, and F1-score metrics, and compared against benchmark models such as BERT and SVM. The results show that DistilBERT achieved an accuracy of 94.8%, slightly below BERT (95.3%) but significantly higher than SVM (90.2%), with computation time reduced by more than 55%. These findings demonstrate that DistilBERT provides an optimal balance between accuracy and efficiency, making it suitable for large scale sentiment analysis on e-commerce platforms. Keywords: Sentiment Analysis, DistilBERT, Shopee Reviews, Natural Language Processing, Deep Learning, Transformer Models.


翻译:数字商务的快速增长导致在线平台上积累了海量的消费者评论。作为东南亚最大的电子商务平台之一,Shopee每天接收数百万条包含客户满意度和偏好宝贵信息的产品评论。对这些评论进行人工分析效率低下,因此需要采用情感分析等计算方法。本研究探讨了使用轻量级基于Transformer的深度学习模型DistilBERT对Shopee产品评论进行情感分类。所用数据集包含约一百万条经过预处理的英文评论,并采用distilbert-base-uncased模型进行训练。评估使用准确率、精确率、召回率和F1分数指标,并与BERT和SVM等基准模型进行比较。结果显示,DistilBERT实现了94.8%的准确率,略低于BERT(95.3%),但显著高于SVM(90.2%),计算时间减少了55%以上。这些发现表明,DistilBERT在准确性和效率之间提供了最佳平衡,适用于电子商务平台的大规模情感分析。关键词:情感分析,DistilBERT,Shopee评论,自然语言处理,深度学习,Transformer模型。

0
下载
关闭预览

相关内容

智能体评判者(Agent-as-a-Judge)研究综述
专知会员服务
37+阅读 · 1月9日
专知会员服务
52+阅读 · 2021年1月19日
深度学习在金融文本情感分类中的应用
AI前线
36+阅读 · 2019年1月12日
Twitter情感分析及其可视化
数据挖掘入门与实战
22+阅读 · 2018年3月20日
情感分析的新方法,使用word2vec对微博文本进行情感分析和分类
数据挖掘入门与实战
22+阅读 · 2018年1月6日
情感分析:数据采集与词向量构造方法
北京思腾合力科技有限公司
29+阅读 · 2017年12月20日
教你用Python爬虫股票评论,简单分析股民用户情绪
数据派THU
10+阅读 · 2017年12月12日
深度学习在情感分析中的应用
CSDN大数据
14+阅读 · 2017年8月22日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
智能体评判者(Agent-as-a-Judge)研究综述
专知会员服务
37+阅读 · 1月9日
专知会员服务
52+阅读 · 2021年1月19日
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员