T=题名(书名、题名),A=作者(责任者),K=主题词,P=出版物名称,PU=出版社名称,O=机构(作者单位、学位授予单位、专利申请人),L=中图分类号,C=学科分类号,U=全部字段,Y=年(出版发行年、学位年度、标准发布年)
AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
范例一:(K=图书馆学 OR K=情报学) AND A=范并思 AND Y=1982-2016
范例二:P=计算机应用与软件 AND (U=C++ OR U=Basic) NOT K=Visual AND Y=2011-2016
摘要:通过对比人工选择特征、相关性检验、降维算法以及基于集成学习的自适应特征提取方法,找出不同的特征选择方法以及不同的分类算法对微博水军的识别带来的影响。实验验证了高区分度的自适应特征提取方法对水军的识别效果带来较大提高,由于特征数量的减少,水军识别所需要的时间花费也明显降低,对于微博网络海量数据的识别具有一定意义。
摘要:通过分析水军用户与正常用户的深层次区别,找到事件参与度、二阶关联性、关系紧密度、引导工具使用率这4个新的特征。利用经典分类算法SVM并选用准确率、召回率、F1值、时间花费和AUC等评价指标对前述新特征与好友值、粉丝值等11个传统特征进行对比实验,验证了新特征在保证对水军高识别率的同时,大幅减少了识别所需的时间花费,为微博海量数据的识别提供了新途径。
地址:宁波市钱湖南路8号浙江万里学院(315100)
Tel:0574-88222222
招生:0574-88222065 88222066
Email:yzb@zwu.edu.cn