看过本文的还看了

相关文献

该作者的其他文献

文献详情 >结合短文本扩展和BERT的商品评论文本自动分类 收藏
结合短文本扩展和BERT的商品评论文本自动分类

结合短文本扩展和BERT的商品评论文本自动分类

作     者:李湘东 孙倩茹 石健 Li Xiangdong;Sun Qianru;Shi Jian

作者机构:武汉大学信息管理学院 武汉大学电子商务研究与发展中心武汉430072 

出 版 物:《信息资源管理学报》 (Journal of Information Resources Management)

年 卷 期:2023年第13卷第1期

页      码:129-139页

摘      要:针对商品评论文本具有短文本及表述用词不规范的特点,探讨如何实现商品评论文本按照商品种类进行自动归类并提高其分类效果。通过TF-IDF和LDA构建训练集的核心词集,利用Word2Vec相似度计算方式对短文本进行特征扩展获得的商品评论文本作为分类对象,基于BERT模型实现分类,并设计相应的对比实验证明本方法的有效性。对商品评论文本扩展后使用BERT分类时,本文方法比未扩展时的F1值提升2.1%,比使用Hownet相似度计算方式扩展时的F1值提升0.9%。从基本原理、不同相似度计算方法以及用词方式等方面分析本方法有效性的原因。本文提出的方法能有效提升商品评论文本按照商品进行信息组织时的分类效果,可以应用于电子商务信息的信息组织及其相关理论方法研究等领域。

主 题 词:商品评论文本 短文本 特征扩展 Word2Vec BERT 

学科分类:1205[管理学-图书情报与档案管理类] 12[管理学] 081203[081203] 08[工学] 0835[0835] 120502[120502] 0812[工学-测绘类] 

核心收录:

D O I:10.13365/j.jirm.2023.01.129

馆 藏 号:203118684...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分