限定检索结果

检索条件"主题词=模型微调"
7 条 记 录,以下是1-10 订阅
视图:
排序:
基于API序列和预训练模型的恶意软件检测
收藏 引用
《计算机工程与设计》2024年 第4期45卷 974-981页
作者:窦建民 师智斌 于孟洋 霍帅 张舒娟中北大学计算机科学与技术学院山西太原030051 
针对现有方法存在特征表达受限、无法捕获API序列全局语义信息,且恶意软件数据集通常包含大量无标注数据,无法直接进行有监督学习等问题,利用自然语言预训练模型技术,提出一种基于API调用序列和预训练模型的恶意软件检测方法。使用原始...
来源:详细信息评论
航天涉密信息保密审核大模型增强方法
收藏 引用
《航天控制》2024年 第2期42卷 62-68页
作者:郑佳斌 周瀚阁 蒋忠林 陈勇浙江大学航空航天学院杭州310058 吉利汽车研究院(宁波)有限公司宁波315311 
针对航天航空领域资料保密审查的严格要求,现有的人工筛查方法存在成本高昂、关键词匹配精度不足等问题,提出了一种结合大模型的审查方法,用于提升涉密信息的筛查效率和准确性。首先分析了航天航空领域涉密信息的特点,提出了一种基于大...
来源:详细信息评论
基于大语言模型的命名实体识别
收藏 引用
《计算机系统应用》2024年 第8期33卷 257-263页
作者:叶名玮 汤嘉 郭燕 吴桂兴中国科学技术大学软件学院合肥230026 中国科学技术大学苏州高等研究院苏州215123 
虽然以ChatGPT为代表的自然语言生成(NLG)大语言模型在自然语言处理中的大多数任务中取得了良好的表现,但其在序列识别任务,如命名实体识别任务中的表现暂且不如基于BERT的深度学习模型.针对这一点,本文探究性的通过将现有的中文命名实...
来源:详细信息评论
以对比学习与时序递推提升摘要泛化性的方法
收藏 引用
《重庆理工大学学报(自然科学)》2024年 第2期38卷 170-180页
作者:汤文亮 陈帝佑 桂玉杰 刘杰明 徐军亮华东交通大学信息工程学院南昌330013 
为了有效缓解基于交叉熵损失函数训练的传统文本摘要模型所面临的推理过程中性能下降、泛化性较低、生成过程中曝光偏差现象严重、生成的摘要与参考摘要文本相似度较低等问题,提出了一种新颖的训练方式,一方面,模型本身以beamsearch的...
来源:详细信息评论
基于粒子群优化的自适应微调算法
收藏 引用
《智能计算机与应用》2024年 第4期14卷 232-237页
作者:冯乐 汤华椿 高亮 邹红梅 王林 谭棉贵州民族大学数据科学与信息工程学院贵阳550025 贵州民族大学贵州省模式识别与智能系统重点实验室贵阳550025 集美大学轮机工程学院福建厦门361000 
模型微调是一种重要的迁移学习技术,在各种缺乏训练数据的任务中取得了显著成功,并且只需少量训练时间就能获得满意效果。然而,随着网络模型规模和结构复杂性增加,为特定目标任务设计合适的微调方案变得越来越困难。为了解决这个问题,...
来源:详细信息评论
基于卷积神经网络的小样本图像识别方法
收藏 引用
《计算机工程与设计》2018年 第1期39卷 224-229页
作者:段萌 王功鹏 牛常勇郑州大学信息工程学院河南郑州450001 
为提高仅包含少量训练样本的图像识别准确率,利用卷积神经网络作为图像的特征提取器,提出一种基于卷积神经网络的小样本图像识别方法。在原始小数据集中引入数据增强变换,扩充数据样本的范围;在此基础上将大规模数据集上的源预训练模型...
来源:详细信息评论
基于时空融合卷积神经网络的异常行为识别
收藏 引用
《计算机工程与设计》2020年 第7期41卷 2052-2056页
作者:王泽伟 高丙朋新疆大学电气工程学院新疆乌鲁木齐830047 
为解决基于RGB图像的异常行为识别无法有效利用帧间运动信息的问题,采用深度学习思想,提出一种基于时空融合方法的双流卷积神经网络对异常行为进行识别。使用VGGNet16构建双流模型,以RGB图片和连续光流帧作为网络的输入,有效利用视频流...
来源:详细信息评论
聚类工具 回到顶部