?

?

《機電工程》雜志,月刊( 詳細... )

中國標準連續出版物號 ISSN 1001-4551 CN 33-1088/TH
主辦單位浙江省機電集團有限公司
浙江大學
主編陳 曉
副 主 編唐任仲、羅向陽(執行主編)
總 經 理羅向陽
出 版浙江《機電工程》雜志社有限公司
地 址杭州市上城區延安路95號浙江省機電集團大樓二樓211、212室
電話Tel+86-571-87041360、87239525
E-mailmeem_contribute@163.com
國外發行中國國際圖書貿易總公司
訂閱全國各地郵局   國外代號M3135
國內發行浙江省報刊發行局
郵發代號32-68
廣告發布登記證:杭上市管廣發G-001號

在線雜志

當前位置: 機電工程 >>在線雜志

基于遺傳算法優化的深度強化學習-PI空氣舵伺服系統控制策略

作者:洪子祺,許文波,呂晨,等 日期:2023-09-20/span> 瀏覽:1282 查看PDF文檔

基于遺傳算法優化的深度強化學習-PI空氣舵伺服
系統控制策略*
洪子祺1,許文波2*,呂晨1,歐陽權1,王志勝1

(1.南京航空航天大學 自動化學院,江蘇 南京 210016;2.北京精密機電控制
設備研究所 航天伺服驅動與傳動技術研究室,北京 100076)


摘要:針對傳統比例積分控制難以選定控制性能更好參數的問題,以空氣舵伺服系統為研究對象,提出了一種基于遺傳算法優化的強化學習PI的控制方法。首先,建立了空氣舵伺服系統的數學模型;然后,采用遺傳算法優化了PI控制器的初始參數;采用深度確定性策略梯度算法對當前PI控制器進行了實時整定,從而實現了對空氣舵伺服系統進行位置指令控制的功能;最后,在Simulink中通過仿真分析,對所采用的方法應用于空氣舵伺服系統的效果進行了驗證。研究結果表明:改進的算法在參數攝動時,具備一定的在線穩定性;在空載情況下,所需要的調節時間要小于遺傳算法-PI、DDPG-PI與傳統PI算法,至少縮短了20%;同時,在負載情況下,相比其他3種方法,改進算法的波動幅值與負載結束后回到穩態時間至少縮短了15%,證明了所使用方法在空氣舵伺服系統里的有效性。

關鍵詞:伺服系統;比例積分(PI)控制器;遺傳算法;深度確定性策略梯度算法;參數優化;Simulink

中圖分類號:TH-39;TJ765文獻標識碼:A文章編號:1001-4551(2023)07-1071-08

本文引用格式:

洪子祺,許文波,呂晨,等.基于遺傳算法優化的深度強化學習-PI空氣舵伺服系統控制策略[J].機電工程,2023,40(7):1071-1078.

HONG Zi-qi, XU Wen-bo, LV Chen, et al. Deep reinforcement learning-PI control strategy of air servo system based on genetic algorithm optimization[J].Journal of Mechanical & Electrical Engineering, 2023,40(7):1071-1078.



?

友情鏈接

浙江機械信息網