看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于认证用户信息的微博用户类型识别方法 收藏
基于认证用户信息的微博用户类型识别方法

基于认证用户信息的微博用户类型识别方法

作     者:黄磊 李寿山 王晶晶 HUANG Lei;LI Shoushan;WANG Jingjing

作者机构:苏州大学计算机与科学技术学院江苏苏州215006 

基  金:国家自然科学基金No.61375073 

出 版 物:《计算机科学与探索》 (Journal of Frontiers of Computer Science and Technology)

年 卷 期:2015年第9卷第6期

页      码:719-725页

摘      要:微博用户可以分为个人用户和非个人用户两种类型。在微博中对这两种用户类型进行自动分类是智能广告、用户个性分析等应用的一项基本任务。针对该任务,提出了一种基于机器学习的自动分类方法。该方法的特色在于,不需要人工标注样本,而是利用微博中认证用户类型的语料作为训练样本构建分类器,用于对非认证用户类型进行分类。具体实现中,将用户名和用户发表的微博文本作为表示用户的样本,使用基于最大熵算法进行用户分类。实验表明这种利用认证用户对非认证用户进行类型分类的方法能够获得较好的效果。

主 题 词:自然语言处理 微博 用户分类 认证 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

核心收录:

D O I:10.3778/j.issn.1673-9418.1409014

馆 藏 号:203182013...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分