文献检索-宁波市创意产业特色资源库

结合近邻传播聚类的世界生成神经网络优化器: 收藏
分享
引用; 《济南大学学报（自然科学版）》2023年第4期37卷 449-456页; 作者：陆敏芳宗伟陈美涵杨波王琳张波济南大学信息科学与工程学院山东济南250022; 为了解决黑盒问题优化领域中传统优化算法在学习问题结构时存在缺乏样本多样性的问题,设计结合近邻传播聚类的世界生成神经网络优化器。该优化器通过独特的世界模型与采样生成器进行协同学习,完成对问题结构的学习并生成更加多样化的解...; 为了解决黑盒问题优化领域中传统优化算法在学习问题结构时存在缺乏样本多样性的问题,设计结合近邻传播聚类的世界生成神经网络优化器。该优化器通过独特的世界模型与采样生成器进行协同学习,完成对问题结构的学习并生成更加多样化的解,以此为基础提出新的优化算法;将所提出的算法与5种有代表性的算法在12个不同特征的优化问题上进行多角度的对比。结果表明,结合近邻传播聚类的世界生成神经网络优化器在不同特征基准问题上平均性能达到最优,准确度平均排名第一,证明了结合近邻传播聚类的世界生成神经网络优化器在学习问题结构的有效性,同时增加了样本的多样性。; 来源：详细信息评论

CARACaS无人自主框架及其感知、控制与协同技术综述: 收藏
分享
引用; 《指挥控制与仿真》2022年第1期44卷 1-19页; 作者：何佳洲胡剑秋张煌江苏自动化研究所江苏连云港222061; 针对CARACaS(Control Architecture for Robotic Agent Command and Sensing)无人自主框架、核心组件、示范验证和应用发展情况进行综述。首先,简要描述了自主框架的组成及其软件架构的设计原则和思路,对行为、动态规划和感知三类引擎...; 针对CARACaS(Control Architecture for Robotic Agent Command and Sensing)无人自主框架、核心组件、示范验证和应用发展情况进行综述。首先,简要描述了自主框架的组成及其软件架构的设计原则和思路,对行为、动态规划和感知三类引擎的技术特征进行分析,讨论了世界模型的构建原则和方式;其次,较为详细地分析了CARACaS技术典型示范验证和拓展应用情况,讨论了水面无人艇自主导航应用中CARACaS感知系统技术演化和发展;然后,考虑CARACaS技术示范验证与美国无人行业领军代表——空间集成系统公司SIS(Spatial Integrated Systems)集成开发工作密切相关,概要总结了SIS集成技术特点和最新进展;最后,结合美军在无人领域重点研究技术的发展情况,给出了几点启示。; 来源：详细信息评论

基于RoboCup3D仿真平台的双足机器人大脚球进攻策略设计: 收藏
分享
引用; 《电子测试》2022年第2期36卷 70-72页; 作者：倪天伟方正赵大暑信阳学院河南信阳464000 皖江工学院安徽马鞍山243031 安徽省教育厅“无人机开发及数据应用”重点实验室安徽马鞍山243031; RoboCup3D仿真系统融合了人工智能、传感器、通信、智能控制等多门学科的相关技术。针对RoboCup3D仿真中双足机器人的踢球动作设计问题(如:踢球力度弱、摔倒等)提出了一种基于大脚球的进攻策略。采用大脚球的进攻策略可以有效的促使足...; RoboCup3D仿真系统融合了人工智能、传感器、通信、智能控制等多门学科的相关技术。针对RoboCup3D仿真中双足机器人的踢球动作设计问题(如:踢球力度弱、摔倒等)提出了一种基于大脚球的进攻策略。采用大脚球的进攻策略可以有效的促使足球快速的踢进对方半场后方,在仿真比赛中极具攻击性。仿真结果验证了它的有效性和实用性。; 来源：详细信息评论

改进的DDPG对话策略优化算法: 收藏
分享
引用; 《计算机工程与设计》2021年第2期42卷 411-418页; 作者：赵崟江李艳玲林民内蒙古师范大学计算机科学技术学院内蒙古呼和浩特010022; 针对任务型对话系统缺少大规模真实训练数据的问题,提出一种结合规划的离散深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法来优化对话策略。在代理方面,改进经典DDPG训练算法中actor网络的输出结构和损失函数,使其...; 针对任务型对话系统缺少大规模真实训练数据的问题,提出一种结合规划的离散深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法来优化对话策略。在代理方面,改进经典DDPG训练算法中actor网络的输出结构和损失函数,使其适用于离散动作空间任务;在环境方面,引入一个环境模型(又称世界模型)来模拟真实用户提问;在整个训练过程中,代理分别与用户模拟器和世界模型交互,结合规划交替使用真实用户经验和模拟用户经验,改进对话策略。实验结果表明,该方法能够加快模型的收敛速度,提升任务成功率。; 来源：详细信息评论

限定检索结果