看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于深度学习的跨自然语言与程序语言生成任务综述 收藏
基于深度学习的跨自然语言与程序语言生成任务综述

基于深度学习的跨自然语言与程序语言生成任务综述

作     者:宋小祎 张若定 张妍 张梅山 黎家通 SONG Xiaoyi;ZHANG Ruoding;ZHANG Yan;ZHANG Meishan;LI Jiatong

作者机构:中国科学院信息工程研究所北京100093 中国科学院大学网络空间安全学院北京100049 哈尔滨工业大学(深圳)计算与智能研究院深圳518055 

基  金:工业互联网创新发展计划(No.TC200H030) 2021年重庆市属本科高校与中科院所属院所合作项目(No.HZ2021015)资助 

出 版 物:《信息安全学报》 (Journal of Cyber Security)

年 卷 期:2023年第8卷第3期

页      码:65-84页

摘      要:近年来,随着人工智能技术的发展,许多编程人员期望计算机代替他们自动完成程序代码或者代码注释的编写等任务。跨自然语言与程序语言(Natural languages and programming languages, NL-PL)生成即为此类任务,指自然语言和程序语言之间的相互转换任务,包括自然语言到程序语言的生成和程序语言到自然语言的生成两类任务。最近几年,跨NL-PL生成在研究与应用方面呈现出爆发式的增长,尤其是随着深度学习(Deep learning,DL)技术的发展,越来越多研究人员开始利用DL技术来提升跨NL-PL生成任务效果。他们通过优化程序表示方式、改进神经网络模型以及设计大型预训练模型等方法,在该领域取得了众多突破性的进展。在基于DL的跨NL-PL生成技术获得迅猛发展的同时,大型互联网公司逐渐将该领域的研究成果付诸商用,因此,模型应用安全性也受到了学术界和业界的紧密关注。为了进一步系统地研究跨NL-PL生成技术,对这些已有的成果进行梳理非常必要。本文以程序生成和注释生成这两类典型跨NL-PL生成任务为切入点,对该领域具有代表性的最新文献进行归纳总结。我们从众多已有参考文献中抽象出一个基于DL的跨NL-PL生成通用实现模型,并将该模型划分为程序表示、语言处理和语言生成三大组件。在我们提出的通用实现模型的基础上,我们进一步从程序代码表示方法、网络模型结构、模型在业界的应用、应用过程中存在的安全问题与安全研究现状、该领域常用数据集和模型效果等方面详细梳理分析已有研究成果及进展脉络。最后,我们总结了该领域现阶段存在的研究问题,并展望了未来的发展方向。

主 题 词:深度学习 跨自然语言与程序语言 程序表示 模型算法 

学科分类:08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类] 

核心收录:

D O I:10.19363/J.cnki.cn10-1380/tn.2023.05.06

馆 藏 号:203122444...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分