限定检索结果

检索条件"主题词=世界模型"
4 条 记 录,以下是1-10 订阅
视图:
排序:
结合近邻传播聚类的世界生成神经网络优化器
收藏 引用
《济南大学学报(自然科学版)》2023年 第4期37卷 449-456页
作者:陆敏芳 宗伟 陈美涵 杨波 王琳 张波济南大学信息科学与工程学院山东济南250022 
为了解决黑盒问题优化领域中传统优化算法在学习问题结构时存在缺乏样本多样性的问题,设计结合近邻传播聚类的世界生成神经网络优化器。该优化器通过独特的世界模型与采样生成器进行协同学习,完成对问题结构的学习并生成更加多样化的解...
来源:详细信息评论
CARACaS无人自主框架及其感知、控制与协同技术综述
收藏 引用
《指挥控制与仿真》2022年 第1期44卷 1-19页
作者:何佳洲 胡剑秋 张煌江苏自动化研究所江苏连云港222061 
针对CARACaS(Control Architecture for Robotic Agent Command and Sensing)无人自主框架、核心组件、示范验证和应用发展情况进行综述。首先,简要描述了自主框架的组成及其软件架构的设计原则和思路,对行为、动态规划和感知三类引擎...
来源:详细信息评论
基于RoboCup3D仿真平台的双足机器人大脚球进攻策略设计
收藏 引用
《电子测试》2022年 第2期36卷 70-72页
作者:倪天伟 方正 赵大暑信阳学院河南信阳464000 皖江工学院安徽马鞍山243031 安徽省教育厅“无人机开发及数据应用”重点实验室安徽马鞍山243031 
RoboCup3D仿真系统融合了人工智能、传感器、通信、智能控制等多门学科的相关技术。针对RoboCup3D仿真中双足机器人的踢球动作设计问题(如:踢球力度弱、摔倒等)提出了一种基于大脚球的进攻策略。采用大脚球的进攻策略可以有效的促使足...
来源:详细信息评论
改进的DDPG对话策略优化算法
收藏 引用
《计算机工程与设计》2021年 第2期42卷 411-418页
作者:赵崟江 李艳玲 林民内蒙古师范大学计算机科学技术学院内蒙古呼和浩特010022 
针对任务型对话系统缺少大规模真实训练数据的问题,提出一种结合规划的离散深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法来优化对话策略。在代理方面,改进经典DDPG训练算法中actor网络的输出结构和损失函数,使其...
来源:详细信息评论
聚类工具 回到顶部