看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于科技政策文本的程度词典构建研究 收藏
基于科技政策文本的程度词典构建研究

基于科技政策文本的程度词典构建研究

作     者:郑新曼 董瑜 Zheng Xinman;Dong Yu

作者机构:中国科学院文献情报中心北京100190 中国科学院大学经济与管理学院图书情报与档案管理系北京100190 

基  金:中国科学院文献情报能力建设专项(项目编号:Y9290002)的研究成果之一 

出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)

年 卷 期:2021年第5卷第10期

页      码:81-93页

摘      要:【目的】利用词典法辨识和量化我国科技政策文本用语中蕴含的决策者态度及其强弱程度,解决现有中文政策文本研究忽视词语语义强度的问题。【方法】立足科技政策的功能定位和用语特征,提出程度词的概念。兼顾数量和语义构建程度词典,包括依据专家知识选取种子词,利用PMI算法进行词语扩展,使用同义词词林筛选词语。最后结合TextRank算法进行实验验证。【结果】经信度和效度检验,构建的程度词典有效,结合程度词典的政策文本分析细粒度优于使用单一的文本挖掘算法。【局限】程度词典的权重设计有待细化。【结论】科技政策文本中的程度词丰富、规范且稳定,具有量化分析的价值;词典法可以有效识别并利用程度词,有助于深入挖掘政策文本的语义特征。

主 题 词:政策文本 特征提取 领域词典构建 意见挖掘 

学科分类:1205[管理学-图书情报与档案管理类] 12[管理学] 120502[120502] 

核心收录:

D O I:10.11925/infotech.2096-3467.2021.0148

馆 藏 号:203106269...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分