限定检索结果

检索条件"机构=中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室"
24 条 记 录,以下是1-10 订阅
视图:
排序:
面向文本摘要的反事实纠偏方法
收藏 引用
计算机学报》2023年 第11期46卷 2400-2415页
作者:陈璐 张儒清 郭嘉丰 范意兴中国科学院计算技术研究所网络数据科学与技术重点实验室北京100190 中国科学院大学北京100190 
文本摘要是自然语言处理领域中一项典型的文本到文本生成任务,旨在提取和概括一篇或多篇输入文档的关键信息,生成简洁、流畅又准确的摘要文本.自动文本摘要技术涉及自然语言理解和自然语言生成技术,并能应用于多种实际场景,包括文档索...
来源:详细信息评论
支持Unikernel的流式计算引擎:Hummer
收藏 引用
计算机学报》2019年 第8期42卷 1755-1766页
作者:李冰 张志斌 钟巧灵 程学旗中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室北京100190 中国科学院大学计算机与控制学院北京100049 
社会计算中,社会公共安全、企业商务智能和舆情计算等众多领域均对实时计算的性能提出了越来越高的要求.流式计算引擎作为大数据计算研究领域的研究热点之一,致力于提供高吞吐量和低延迟的实时计算能力.流式处理任务对处理延迟非常敏感...
来源:详细信息评论
深度文本匹配综述
收藏 引用
计算机学报》2017年 第4期40卷 985-1003页
作者:庞亮 兰艳艳 徐君 郭嘉丰 万圣贤 程学旗中国科学院网络数据科学与技术重点实验室北京100190 中国科学院计算技术研究所北京100190 中国科学院大学北京100190 
自然语言理解的许多任务,例如信息检索、自动问答、机器翻译、对话系统、复述问题等等,都可以抽象成文本匹配问题.过去研究文本匹配主要集中在人工定义特征之上的关系学习,模型的效果很依赖特征的设计.最近深度学习自动从原始数据学习...
来源:详细信息评论
多段落中文阅读理解模型
收藏 引用
《模式识别与人工智能》2019年 第2期32卷 161-168页
作者:赵峻瑶 庞亮 苏立新 兰艳艳 郭嘉丰 程学旗中国科学院计算技术研究所网络数据科学与技术重点实验室北京100190 中国科学院大学计算机与控制学院北京100190 
解决多段落中文阅读理解任务需要考虑证据段落的稀疏性、中文语义的多样性和答案片段的有效性.基于此种情况,文中设计多段落中文阅读理解模型,利用数据增强的方式学习不包含答案的段落,利用字级别编码和中文词性标注丰富中文的语义表示...
来源:详细信息评论
基于梯度的对抗排序攻击方法
收藏 引用
《模式识别与人工智能》2022年 第3期35卷 254-261页
作者:吴晨 张儒清 郭嘉丰 范意兴中国科学院计算技术研究所网络数据科学与技术重点实验室北京100190 中国科学院大学计算机与控制学院北京100190 
互联网检索中普遍存在排名竞争这种对抗攻击行为,会产生许多不良影响,因此对攻击方法的研究有助于设计更鲁棒的排序模型.已有的攻击方法容易被人识别且无法有效攻击神经排序模型.因此,文中提出基于梯度的对抗排序攻击方法.方法分为3个模...
来源:详细信息评论
面向多片段答案的抽取式阅读理解模型
收藏 引用
计算机学报》2020年 第5期43卷 856-867页
作者:苏立新 郭嘉丰 范意兴 兰艳艳 徐君 程学旗中国科学院计算技术研究所网络数据科学与技术重点实验室北京100190 中国科学院大学北京100190 中国科学院大学北京100049 
随着搜索技术的发展,抽取式阅读理解已经成为搜索引擎中重要的组成部分.给定问题和文本,抽取式阅读理解任务要求从文本中定位出问题的答案.已有工作仅考虑答案片段由文本中的一个片段组成的情况,因此把该问题建模为输入问题和文本,预测...
来源:详细信息评论
基于相关修正的无偏排序学习方法
收藏 引用
计算研究与发展》2022年 第12期59卷 2867-2877页
作者:王奕婷 兰艳艳 庞亮 郭嘉丰 程学旗中国科学院网络数据科学与技术重点实验室(中国科学院计算技术研究所)北京100190 中国科学院大学北京100049 清华大学智能产业研究院北京100084 中国科学院计算技术研究所数据智能系统研究中心北京100190 
用户点击数据较文档的相关标签更易被获取且能反映用户兴趣,将其作为标签能够有效降低人工标注成本并且模型能随数据实时更新.但用户点击含有偏差和噪声,因此需设计有效的无偏排序方法.针对无偏排序中对偶学习方法收敛得到次优解从而无...
来源:详细信息评论
知识图谱可解释推理研究综述
收藏 引用
《软件学报》2022年 第12期33卷 4644-4667页
作者:侯中妮 靳小龙 陈剑赟 官赛萍 王元卓 程学旗中国科学院网络数据科学与技术重点实验室(中国科学院计算技术研究所)北京100190 中国科学院大学计算机科学与技术学院北京100049 北京市信息技术研究所北京100094 
面向知识图谱的知识推理旨在通过已有的知识图谱事实,去推断新的事实,进而实现知识库的补全.近年来,尽管基于分布式表示学习的方法在推理任务上取得了巨大的成功,但是他们的黑盒属性使得模型无法为预测出的事实做出解释.以,如何设计...
来源:详细信息评论
基于多表达的第一阶段语义检索模型
收藏 引用
计算机工程与应用》2023年 第4期59卷 139-146页
作者:蔡银琼 范意兴 郭嘉丰 张儒清中国科学院计算技术研究所网络数据科学与技术重点实验室北京100190 中国科学院大学北京100190 
当前,信息检索系统通常采用“检索+重排序”的多级流水线架构。基于稠密表示的检索模型已经被逐渐应用到第一阶段检索中,并展现出了相比传统的稀疏向量空间模型更好的性能。考虑到第一阶段检索需的高效性,大多数情况下这些模型的基本...
来源:详细信息评论
SparkCRF:一种基于Spark的并行CRFs算法实现
收藏 引用
计算研究与发展》2016年 第8期53卷 1819-1828页
作者:朱继召 贾岩涛 徐君 乔建忠 王元卓 程学旗东北大学计算机科学与工程学院沈阳110819 中国科学院计算技术研究所网络数据科学与技术重点实验室北京100190 
条件随机场(condition random fields,CRFs)可用于解决各种文本分析问题,如自然语言处理(natural language processing,NLP)中的序列标记、中文分词、命名实体识别、实体间关系抽取等.传统的运行在单节点上的条件随机场在处理大规模文本...
来源:详细信息评论
聚类工具 回到顶部