限定检索结果

检索条件"主题词=A3C"
3 条 记 录,以下是1-10 订阅
视图:
排序:
基于异步优势演员-评论家的交通信号控制方法
收藏 引用
《浙江大学学报(工学版)》2024年 第8期58卷 1671-1680,1703页
作者:叶宝林 孙瑞涛 吴维敏 陈滨 姚青浙江理工大学信息科学与工程学院浙江杭州310018 嘉兴大学嘉兴市智慧交通重点实验室浙江嘉兴314001 浙江大学工业控制技术全国重点实验室智能系统与控制研究所浙江杭州310027 浙江理工大学计算机科学与技术学院浙江杭州310018 
针对现有基于深度强化学习的交通信号控制方法的模型学习和决策成本高的问题,提出基于异步优势演员-评论家(a3c)算法的单交叉口交通信号控制方法.在模型输入端分别从交叉口和车道2个不同维度构建车辆权重增益网络,对采集的车辆状态信息...
来源:详细信息评论
智能仓储交通信号与多AGV路径规划协同控制方法
收藏 引用
《计算机工程与应用》2024年 第11期60卷 290-297页
作者:司明 邬伯藩 胡灿 邢伟强西安科技大学计算机科学与技术学院西安710054 
针对智能仓储多AGV(automated guided vehicle)路径规划实时性差,障碍物识别能力弱,多AGV碰撞、死锁和拥堵等问题,提出了一种智能仓储交通信号控制与多AGV路径规划协同控制方法,将交通信号与多AGV路径规划视为一个整体,设计一种交通信...
来源:详细信息评论
强化学习a3c算法在电梯调度中的建模及应用
收藏 引用
《计算机工程与设计》2022年 第1期43卷 196-202页
作者:刘宇 张聪 李涛武汉大学计算机学院湖北武汉430000 武汉轻工大学数学与计算机学院湖北武汉430000 国网湖北省电力有限公司荆州供电公司发展策划部湖北荆州434000 
为让电梯调度算法在电梯电力能耗、用户乘梯体验和算法适应性方面具备更好表现,在目前主流的电梯调度算法基础之上,提出对调度环境、电梯行为和调度目标3个方面进行统一建模的基于强化学习a3c的电梯智能调度算法。让调度电梯在不断地和...
来源:详细信息评论
聚类工具 回到顶部