看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于网络爬虫的法律文本纠错词库构建 收藏
基于网络爬虫的法律文本纠错词库构建

基于网络爬虫的法律文本纠错词库构建

作     者:刘明洁 李珅 梁毅 LIU Ming-jie;LI Shen;LIANG Yi

作者机构:北京工业大学信息学部计算机学院北京100124 中国司法大数据研究院有限公司北京100043 

基  金:国家重点研发计划(批准号:2018YFC0831200) 

出 版 物:《软件》 (Software)

年 卷 期:2020年第41卷第5期

页      码:57-60页

摘      要:为了构建全面而且准确的法律文本纠错词库,本文提出基于网络爬虫的词库构建方法。此方法以常用爬虫为基础,扩展主题选取、网页排序等功能模块以提高爬虫的精准度和查全率。在得到数据后进行数据清洗以筛选有用词汇形成最终可使用的专业纠错词库。通过系统试运行验证了本爬虫设计方案的可行性,可以为相关词库的构建提供支持。

主 题 词:网络爬虫 法律文本 分词词库 

学科分类:081203[081203] 08[工学] 0835[0835] 0812[工学-测绘类] 

D O I:10.3969/j.issn.1003-6970.2020.05.011

馆 藏 号:203941849...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分