看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于自监督网络的DDPG算法的建筑能耗控制 收藏
基于自监督网络的DDPG算法的建筑能耗控制

基于自监督网络的DDPG算法的建筑能耗控制

作     者:殷雨竹 陈建平 傅启明 陆悠 吴宏杰 YIN Yu-Zhu;CHEN Jian-Ping;FU Qi-Ming;LU You;WU Hong-Jie

作者机构:苏州科技大学电子与信息工程学院苏州215009 苏州科技大学江苏省建筑智慧节能重点实验室苏州215009 苏州科技大学苏州市移动网络技术与应用重点实验室苏州215009 

基  金:国家重点研发计划(2020YFC200660) 国家自然科学基金(62072324,61876217,61876121,61772357) 江苏省重点研发计划(BE2017663) 

出 版 物:《计算机系统应用》 (Computer Systems & Applications)

年 卷 期:2022年第31卷第2期

页      码:161-167页

摘      要:针对强化学习方法训练能耗控制系统时所存在奖赏稀疏的问题,将一种基于自监督网络的深度确定策略梯度(deep deterministic policy gradient,DDPG)方法应用到建筑能耗控制问题中.首先,处理状态和动作变量作为自监督网络前向模型的输入,预测下一个状态特征向量,同时将预测误差作为好奇心设计内部奖赏,以解决奖赏稀疏问题.然后,采用数据驱动的方法训练建筑能耗模型,构建天气数据作为输入、能耗数据作为输出.最后,利用基于自监督网络的DDPG方法求解最优控制策略,并以此设定空气处理装置(air handling unit,AHU)的最优排放温度,减少设备能耗.实验结果表明,该方法能够在保持建筑环境舒适的基础上,实现较好的节能效果.

主 题 词:强化学习 自监督网络 DDPG算法 能耗控制 

学科分类:12[管理学] 1201[管理学-管理科学与工程类] 081104[081104] 08[工学] 081304[081304] 0835[0835] 0813[工学-化工与制药类] 0811[工学-水利类] 0812[工学-测绘类] 

D O I:10.15888/j.cnki.csa.008365

馆 藏 号:203107371...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分