看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于语义网的中文百科知识组织与集成 收藏
基于语义网的中文百科知识组织与集成

基于语义网的中文百科知识组织与集成

作     者:付宇新 王鑫 冯志勇 吕雪栋 FU Yuxin;WANG Xin;FENG Zhiyong;LV Xuedong

作者机构:天津大学计算机科学与技术学院计算机科学与技术系天津300072 天津市认知计算与应用重点实验室天津300072 

基  金:国家自然科学基金(No.61100049 No.61070202) 国家高技术研究发展计划(863)(No.2013AA013204) 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2015年第51卷第14期

页      码:120-126,169页

摘      要:通过从3个最大的中文百科全书(百度百科、互动百科、中文维基百科)所包含的大规模知识数据中识别重要的结构化特征生成RDF三元组,并将这些信息数据整合加入分布式大规模RDF数据存储系统,从而构成符合Linked Data要求的中文百科知识库RDF数据集。主要工作包括,通过配置网络爬虫对百度百科和互动百科的网页进行爬取,解析其中信息框等内容,生成RDF三元组并实现三元组的动态插入;下载需要的DBpedia中文三元组数据,将三元组进行整合并存储到课题组的大规模语义数据存储库Jingwei中;设计显示动态插入和三元组模式查询的页面,通过原型系统实验,验证了该方法的有效性。

主 题 词:语义网 资源描述框架(RDF) 中文百科全书 Linked Open Data Nutch 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3778/j.issn.1002-8331.1308-0195

馆 藏 号:203505335...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分