文献详情 >基于深度学习的跨自然语言与程序语言生成任务综述收藏

基于深度学习的跨自然语言与程序语言生成任务综述

作者：宋小祎张若定张妍张梅山黎家通 SONG Xiaoyi;ZHANG Ruoding;ZHANG Yan;ZHANG Meishan;LI Jiatong

作者机构：中国科学院信息工程研究所北京100093 中国科学院大学网络空间安全学院北京100049 哈尔滨工业大学(深圳)计算与智能研究院深圳518055

基　　金：工业互联网创新发展计划(No.TC200H030) 2021年重庆市属本科高校与中科院所属院所合作项目(No.HZ2021015)资助

出版物：《信息安全学报》 (Journal of Cyber Security)

年卷期：2023年第8卷第3期

页码：65-84页

摘要：近年来,随着人工智能技术的发展,许多编程人员期望计算机代替他们自动完成程序代码或者代码注释的编写等任务。跨自然语言与程序语言(Natural languages and programming languages, NL-PL)生成即为此类任务,指自然语言和程序语言之间的相互转换任务,包括自然语言到程序语言的生成和程序语言到自然语言的生成两类任务。最近几年,跨NL-PL生成在研究与应用方面呈现出爆发式的增长,尤其是随着深度学习(Deep learning,DL)技术的发展,越来越多研究人员开始利用DL技术来提升跨NL-PL生成任务效果。他们通过优化程序表示方式、改进神经网络模型以及设计大型预训练模型等方法,在该领域取得了众多突破性的进展。在基于DL的跨NL-PL生成技术获得迅猛发展的同时,大型互联网公司逐渐将该领域的研究成果付诸商用,因此,模型应用安全性也受到了学术界和业界的紧密关注。为了进一步系统地研究跨NL-PL生成技术,对这些已有的成果进行梳理非常必要。本文以程序生成和注释生成这两类典型跨NL-PL生成任务为切入点,对该领域具有代表性的最新文献进行归纳总结。我们从众多已有参考文献中抽象出一个基于DL的跨NL-PL生成通用实现模型,并将该模型划分为程序表示、语言处理和语言生成三大组件。在我们提出的通用实现模型的基础上,我们进一步从程序代码表示方法、网络模型结构、模型在业界的应用、应用过程中存在的安全问题与安全研究现状、该领域常用数据集和模型效果等方面详细梳理分析已有研究成果及进展脉络。最后,我们总结了该领域现阶段存在的研究问题,并展望了未来的发展方向。

主题词：深度学习跨自然语言与程序语言程序表示模型算法

学科分类：08[工学] 0835[0835] 081202[081202] 0812[工学-测绘类]

核心收录：

D　O　I：10.19363/J.cnki.cn10-1380/tn.2023.05.06

馆藏号：203122444...

维普期刊资源

目录详情 | 试阅读 | 预约结果

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于深度学习的跨自然语言与程序语言生成任务综述

读者评论与其他读者分享你的观点

收藏书架

请选择收藏分类：

选择图书所在场馆

申请转借

高级检索 表达式检索

时间限定

文献类型

馆藏选择

核心期刊

语言

高级检索 表达式检索

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

看过本文的还看了

相关文献

该作者的其他文献

基于深度学习的跨自然语言与程序语言生成任务综述

读者评论 与其他读者分享你的观点

收藏书架

请选择收藏分类： 新增自定义分类 确定 取消

选择图书所在场馆

申请转借

高级检索表达式检索

高级检索表达式检索

读者评论与其他读者分享你的观点

请选择收藏分类：