Best Ergodic Averages via Optimal Graph Filters in Reversible Markov Chains
本文提出了一种基于图滤波器的方法,通过定义可逆马尔可夫链上的图信号变化率并引入伯恩斯坦、切比雪夫和勒让德三种最优滤波器,显著加速了遍历平均向目标值的收敛速度。
361 篇论文
本文提出了一种基于图滤波器的方法,通过定义可逆马尔可夫链上的图信号变化率并引入伯恩斯坦、切比雪夫和勒让德三种最优滤波器,显著加速了遍历平均向目标值的收敛速度。
本文提出了一种基于线性时序逻辑(LTL)的风险感知自动驾驶方法,通过将包含事件时序与严重程度的 LTL 规范转化为线性规划问题,实现了在 Carla 仿真中平衡碰撞风险与交通违规等多类风险的类人驾驶策略合成。
本文针对具有稳定与不稳定模态流的脉冲切换系统,在满足模态依赖平均驻留时间和停留时间条件下,通过提出非增与递减两类时变 ISS-Lyapunov 函数,证明了其存在性是系统输入状态稳定(ISS)的充要条件,并给出了从非增函数构造递减函数的方法以及针对未知切换信号的 ISS 保证策略。
该论文提出了一种名为 C* 的新型采样算法,通过构建快速覆盖图(RCG)在未知环境中实现实时全覆盖路径规划,该算法具备计算简单、能自动适应局部覆盖空洞并避免死胡同等特性,经仿真与实验验证,其在覆盖时间、轨迹长度及重叠率等关键指标上均显著优于现有方法。
本文提出了名为 LUCIFER 的推理型中间件,通过“信号契约”将在线自然语言更新解耦为策略先验、奖励势、可行约束及遥测动作预测等控制信号,从而在保持决策器语言无关性的同时,显著提升了自主系统在动态环境中的安全性与信息收集效率。
本文通过在 Mujoco 环境中对 PPO 智能体施加内部参数扰动与外部对抗攻击,利用突触滤波方法将网络参数分类为脆弱、鲁棒或反脆弱,从而揭示了增强策略适应性的反脆弱参数并提出了改进 RL 系统鲁棒性的新途径。
本文提出并验证了一种适用于低成本无力觉传感器的四通道双边遥操作框架,通过结合非线性动力学补偿与基于扰动观测器的状态估计,实现了高速接触场景下的稳定力反馈控制,并显著提升了模仿学习演示数据的成功率。
本文提出了 CBF-RL 框架,通过在训练阶段将控制障碍函数(CBF)安全过滤机制内化到强化学习策略中,使智能体在无需运行时安全过滤器的情况下即可实现安全探索、快速收敛及在真实机器人上的鲁棒安全部署。
该论文揭示了现有针对多智能体系统控制流劫持的防御机制存在根本性缺陷,并提出并评估了受控制流完整性与最小权限原则启发的新防御方案 ControlValve,通过生成许可控制流图并强制执行上下文规则来有效阻断此类攻击。
本文介绍了 TEMPO-VINE 数据集,这是首个针对葡萄园环境设计的大规模多时相多模态公开数据集,通过整合异构激光雷达、AHRS、RTK-GPS 和相机数据,填补了农业领域缺乏真实复杂条件下自动驾驶基准的空白,旨在推动定位、建图及传感器融合技术的发展。
本文展示了一种基于单晶铌酸锂双压电结构的微机械超声换能器(PMUT),通过优化几何结构实现了高机电耦合系数与发射效率,并验证了其在高达 600°C 下稳定运行及 900°C 下存活的卓越耐高温性能。
本文提出了一种基于磨光(mollification)技术的高效路径生成方法,该方法能够将非可微的规划路径转化为满足任意精度和曲率约束的可微平滑路径,其计算效率优于传统插值方法,适用于实时嵌入式控制。
本文提出了一种利用稀疏插值进行部分 Gröbner 基计算及高效搜索固定次数多项式的算法,用于从多变量有理函数域的子域生成集中寻找简化生成集,并通过结构参数可识别性等案例证明其在效率与结果质量上均优于现有方法。
本文提出了一种基于神经算子的无限维闭环逆运动学方法,通过可微分神经算子学习致动到形状的映射并结合无限维链式法则,解决了欠驱动软体机器人因构型空间无限维而难以进行运动学逆解的难题。
本文研究了在 Rényi 差分隐私约束下,通过联合优化融合策略与状态估计器,实现多传感器时间序列数据实时最优融合的方法,该方法能自适应分配隐私预算并以闭环方式调节对手信念,最终通过交通密度估计案例验证了框架的有效性。
本文提出了一种基于元认知地图和系统建模语言(SysML)的系统之系统(SoS)收敛范式,旨在通过整合现实观测、系统思维、可视化建模、数学与计算五大领域,打破学科壁垒以应对气候变化等人类世复杂社会挑战,并通过切萨皮克湾流域案例验证了其在跨学科决策中的有效性。
本文提出了一种面向混合交通瓶颈场景的双交互感知协同控制策略(DIACC),通过结合多智能体强化学习框架下的去中心化交互自适应决策、集中式交互增强评估器及软最小值奖励设计,有效提升了网联自动驾驶车辆在复杂人机混行环境下的交通效率与适应性。
本文提出了 AMV-L 框架,通过基于效用值的生命周期管理和受控检索集大小,解决了长周期 LLM 代理因内存无限累积导致的尾部延迟问题,在保持检索质量的同时显著提升了系统吞吐量并大幅降低了极端延迟。
本文提出了一种风险感知形式化方法,通过显式建模系统轨迹对环境的影响及不确定性下的复杂目标关系,为多目标轨迹评估构建了具有一致性且可解释的预序关系。
本文提出了一种融合可见光通信与无源反向散射的联合架构以构建环境物联网,通过阐述其基本原理、系统设计与三种原型设备的实验验证,展示了该技术在多场景下的应用潜力并展望了未来研究方向。