Learning responsibility allocations for multi-agent interactions: A differentiable optimization approach with control barrier functions
该论文提出了一种基于控制障碍函数和可微优化的数据驱动方法,通过量化智能体为安全交互而调整自身行为的意愿(即责任分配),从数据中学习并解释多智能体交互中的安全规范。
301 篇论文
该论文提出了一种基于控制障碍函数和可微优化的数据驱动方法,通过量化智能体为安全交互而调整自身行为的意愿(即责任分配),从数据中学习并解释多智能体交互中的安全规范。
该论文提出了一种基于无监督学习的双阶段框架,利用未标记的故障数据联合识别深空栖息地中的潜在故障模式并筛选关键传感器,从而在缺乏先验知识的情况下实现更准确的剩余寿命预测。
本文提出了一种通过凸半定规划来抑制参数分布偏移的鲁棒控制方法,旨在解决非线性系统在增益调度等场景下因状态 - 输入空间变化导致模型参数分布发生漂移的问题,确保控制器对未来数据的分布具有鲁棒性。
该论文提出了一种针对非线性神经反馈系统的前向可达性分析新算法,通过利用系统非线性转换函数结构计算紧密的多面体包络并将其编码为混合整数线性规划(MILP),实现了比现有最先进方法快一个数量级的安全验证效果。
本文提出了一种结合输入正则化滤波器的滤波控制障碍函数(FCBF)框架,通过统一二次规划将高阶控制障碍函数(HOCBF)与滤波器相结合,在确保系统安全性的同时,为控制输入提供了严格的利普希茨连续性保证,从而有效避免了控制信号的突变并满足执行器限制。
本文提出了一种分布式模型预测控制框架,用于在个体及耦合约束下协调异构非线性多智能体系统,通过优化人工参考轨迹使协作任务目标在智能体交互中涌现,并证明了该方法的递归可行性、渐近稳定性及瞬态性能。
本文提出了 CONQURE,这是一个开源的量子与经典资源协同执行环境,通过模块化调度框架和 OpenMP 扩展,实现了将量子内核无缝集成到高性能计算与机器学习工作流中,并显著降低了运行开销。
该论文提出了一种基于主动学习的混合估计与控制策略,通过优化初始控制输入序列以增强纯角度初始相对轨道确定(IROD)的可观测性,进而实现从批处理估计到扩展卡尔曼滤波及模型预测控制的无缝衔接,从而可靠地完成自主交会对接任务。
本文提出了一种通过求解有限时域博弈来近似无限时域线性二次动态博弈反馈纳什均衡的方法,在建立均衡存在唯一性条件及高效算法的同时,证明了该策略的总成本收敛性并给出了误差上界。
本文通过硬件实验验证了角下垂控制在直流/交流构网型变流器中的应用,解决了离散化与时钟漂移等实现难题,并证明了其在黑启动、功率分配及频率同步等方面的有效性。
本文提出了一种结合深度强化学习与有界极值搜索的混合控制方法,利用前者处理多参数系统的高效学习能力与后者应对时变不确定性的鲁棒性,显著提升了非线性时变系统的控制性能。
该论文提出了一种名为 AffPCL 的新型个性化协同学习框架,通过精心设计的偏差校正与重要性校正机制,在无需预先知晓系统异质性水平的情况下,实现了从同质环境下的线性加速到异质环境下的独立学习基线之间的自适应平滑过渡,并揭示了即使在高度异质条件下协作仍能获得线性加速的新见解。
本文提出了一种名为 IMAS的算法,通过在去中心化部分可观测马尔可夫决策过程(Dec-POMDP)框架下联合优化感知代理选择与基于互信息的主动感知策略,利用目标函数的次模性在无限策略空间中实现了具有性能保证的协同感知解决方案。
该论文提出了一种名为 PACS 的路径一致性安全过滤方法,通过基于集合可达性分析对扩散策略生成的轨迹进行一致性制动,在动态环境中为机器人提供形式化安全保证的同时,有效避免了传统安全机制因偏离训练分布而导致的任务性能下降。
该研究评估了基于多通道线性描述符的块场方法(MLD-BFM)在 HD sEMG 多自由度手指运动解码中的表现,发现其虽在数值上优于传统特征和降维方法,但统计上未显著超越时域特征,表明高密度记录本身已通过幅度描述符编码了空间信息,而保留空间分辨率对准确回归至关重要。
本文提出了 EMFusion,这是一种基于条件扩散框架的频选电磁场概率预测模型,它通过集成多源上下文信息、采用残差 U-Net 与交叉注意力机制以及基于插补的采样策略,实现了对无线网络中多运营商、多频段电磁场水平的精准预测与可信的不确定性量化。
本文介绍了一种针对模块化自重构机器人 SnailBot 的相对定位系统设计,该系统通过融合 ArUco 标记识别、光流分析与 IMU 数据处理,实现了动态场景下鲁棒且准确的实时相对定位。
本文通过将洛伦兹多项式与完全对数凹多项式理论推广至任意凸锥 ,构建了 -洛伦兹形式及其相关锥的几何与代数性质,揭示了其与锥限制 Rayleigh 不等式、负相关性解释以及锥约束演化变分不等式系统 Lyapunov 稳定性之间的深刻联系。
本文利用性能估计问题(PEP)证明了在分布式优化中引入局部更新(特别是仅需两次)可在保持步长的同时加速收敛,从而首次严格确立了局部更新对一类广泛目标函数的加速效果。
本文提出了一种结合混合触觉感知(压电与压阻传感器)与内部力优化的混合学习及模型驱动方法,通过实时检测滑移并在线调整零空间内力,实现了多指机器人夹持在 35-40 毫秒延迟内的快速闭环防滑稳定控制。