Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks

本文提出了一种基于数字孪生多保真网络的层次化强化学习框架,通过联合优化天线倾角调整策略与物理/虚拟网络数据采集比例,在满足时延约束的同时最大化用户数据速率,并显著降低了物理网络的数据采集延迟。

Hanzhi Yu, Hasan Farooq, Julien Forgeat, Shruti Bothe, Kristijonas Cyras, Md Moin Uddin Chowdhury, Mingzhe ChenWed, 11 Ma🤖 cs.LG

Amplitude Dependent Bode Diagrams via Scaled Relative Graphs

本文提出了一种基于缩放相对图(SRG)和索伯列夫理论的方法,通过限制输入频率和能量范围来计算非线性 Lur'e 系统的L2L_2增益界,从而构建出一种将L2L_2增益表示为频率和能量函数的三维非线性 Bode 图,该方法在特定输入集上比传统全L2L_2空间分析更具优势,且能退化为线性 Bode 图或L2L_2增益。

Julius P. J. Krebbekx, Roland Tóth, Amritam Das, Thomas ChaffeyWed, 11 Ma⚡ eess