看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于CodeBERT的设计模式语言模型 收藏
基于CodeBERT的设计模式语言模型

基于CodeBERT的设计模式语言模型

作     者:陈时非 刘东 江贺 CHEN Shifei;LIU Dong;JIANG He

作者机构:大连理工大学软件学院辽宁大连116620 

基  金:国家自然科学基金(61722202) 

出 版 物:《计算机科学》 (Computer Science)

年 卷 期:2023年第50卷第12期

页      码:75-81页

摘      要:设计模式是对实际软件设计方案的经验性总结,是软件开发中辅助软件设计的有效方案之一。现有设计模式挖掘研究的任务大多是在源代码中识别设计模式的实例,少有考虑用自然语言语料对设计模式建模。为了提升设计模式语言分类模型的推荐效果,将代码、类图或对象协作纳入考虑范围,提出了一种基于CodeBERT的设计模式分类挖掘模型dpCodeBERT,以实现自然语言与代码语言的对照理解。首先,通过随机组合合成多分类算法数据和代码搜索数据作为模型输入,dpCodeBERT模型能够获取transformer层中的模型为令牌生成的注意力权重;然后,分析令牌和语句注意力权重以发现更有效的模型输入类别,进一步改造训练输入;最后,dpCodeBERT模型能够通过全连接层将分布式特征映射到样本空间并输出复数值的方式实现具体软件工程任务,如设计模式选择和设计模式代码搜索任务。在拥有80个软件设计问题的设计模式选择任务的数据集上的实验结果显示,相比同类基准模型,所提模型在设计模式检测准确率(RCDDP)和平均倒数排名(MRR)两个指标上平均提升了10%~20%,设计模式选择更加准确。通过深度研究模型数据需求,dpCodeBERT挖掘了CodeBERT对类级代码的理解,探索了CodeBERT在设计模式挖掘中的应用,具有预测准确、拓展性强等特点。

主 题 词:设计模式挖掘 自然语言处理 预训练语言模型 CodeBERT 模型精调 向量化 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

D O I:10.11896/jsjkx.230100115

馆 藏 号:203124813...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分