说明:利用强化学习的自适应动态规划中的值迭代和策略迭代方法,神经网络控制方法,LQR状态调节器最优控制方法,实现了三维倒立摆在飞行器上的稳定控制。鲁棒性很强,进行了高斯白噪声的扰动实验。
inverted neural Adaptive dynamic 策略迭代学习 策略迭代 matlab 策略迭代控制
说明:本文研究了有限反馈下基于博弈论的联合功率分配与反馈速率控制优化问题。通过建立新的博弈模型,证明了其纳什均衡的存在性。同时,根据功率与反馈速率的关系,提出了一种迭代算法,可快速收敛到博弈不动点。仿真结果表明,联合优化算法的性能优于单单考虑反馈速率的算法。
有限反馈 功率优化分配 博弈功率控制 博弈迭代功率