Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space
该论文提出了一种新的耦合振荡器网络(CON)模型,通过赋予其拉格朗日系统结构、证明全局输入 - 状态稳定性并建立输入与潜在空间力的可逆映射,实现了基于原始像素反馈的机械系统高效潜在空间闭环控制。
6191 篇论文
该论文提出了一种新的耦合振荡器网络(CON)模型,通过赋予其拉格朗日系统结构、证明全局输入 - 状态稳定性并建立输入与潜在空间力的可逆映射,实现了基于原始像素反馈的机械系统高效潜在空间闭环控制。
本文提出了 xTED 框架,利用专门设计的扩散模型在数据层面直接对源域轨迹进行编辑以弥合跨域差距,从而在无需复杂模型架构的情况下显著提升目标域策略学习的性能。
本文提出了一种基于自举去噪能量匹配(BNEM)的新型玻尔兹曼采样器,该方法通过直接学习能量函数并结合自举技术平衡偏差与方差,在二维高斯混合模型和双势阱势等任务中展现了比现有方法更优越的性能和鲁棒性。
该论文针对具有通用状态和动作空间的有限时域马尔可夫决策过程,通过建立政策优化的聚克 - 洛雅斯维奇 - 库尔德卡(PŁK)条件,证明了策略梯度方法能在非凸景观下以非渐近速率收敛至全局最优策略,并首次为多周期库存系统和随机现金平衡问题提供了样本复杂度保证。
该论文提出了一种基于常时滞神经延迟微分方程(NDDEs)的框架,通过借鉴 Mori-Zwanzig 形式体系将隐藏变量转化为记忆项,从而在部分可观测条件下高效地学习非马尔可夫动力学系统。
该论文提出了 LS-Imagine 方法,通过构建长短期世界模型并模拟目标导向的跳跃状态转移,有效扩展了视觉强化学习智能体的想象视野,从而显著提升了 MineDojo 等开放世界环境中长程决策的探索效率。
该论文通过将动量 SGD 对抗训练视为离散时间动力系统并引入 PAC-Bayes 分析框架,从学习动态角度揭示了鲁棒过拟合的机制,并解释了鲁棒权重扰动在抑制损失曲率与优化效率之间的权衡。
该论文表明,在无需测试时梯度更新或显式系统模型的情况下,基于上下文学习的 Transformer 能够隐式推断隐藏状态,从而在从线性高斯到非线性等各种动态系统中实现媲美卡尔曼滤波及粒子滤波等经典方法的输出预测性能。
本文提出了一种名为自适应迁移聚类(ATC)的统一框架,该算法通过优化偏差 - 方差分解,能够在主数据集与辅助数据集存在未知差异的情况下自动利用共性,从而在包括高斯混合模型在内的多种统计模型中实现最优的聚类效果并量化迁移收益。
本文提出了一种用于求解双块非凸非光滑优化问题的学习近端交替最小化算法(LPAM)及其对应的可解释网络(LPAM-net),通过结合平滑技术、残差学习与块坐标下降策略证明了算法的收敛性,并在联合多模态 MRI 重建任务中展现了参数高效与优越的性能。
该论文提出了一种通过重建视觉基元来学习高层结构解释的神经符号系统,其在组织病理学图像异常诊断任务中不仅比传统深度学习架构具有更高的分类准确率,还具备更强的可解释性。
该论文提出了 Puppet-CNN 框架,通过将卷积层参数建模为受神经微分方程控制的连续动态系统,实现了根据输入复杂度自适应调整有效层数,从而在保持竞争力的同时显著减少了可训练参数。
该论文提出了一种输入自适应生成动力学框架,通过训练扩散模型适应不同的生成轨迹,使其能根据样本复杂度动态调整生成过程,从而在保持图像生成质量的同时减少平均采样步数。
本文提出了一种基于聚类分析的步态任务集优化策略,通过筛选最小且具代表性的任务组合来训练神经网络,在显著降低数据采集成本的同时,实现了与使用全量任务集相当的髋关节力矩估计精度。
该论文提出了一种基于有限维表示的轻量级参数化方法,用于从含噪点观测中估计光滑函数及其导数,该方法不仅实现了极小极大最优的一致收敛速率和内存效率,还通过推导有限样本界与下界证明了其最优性,从而克服了传统核估计器在实时应用中计算与存储成本过高的问题。
本文综述了生成式扩散模型(GDM)在大规模 MIMO 通信中的应用潜力,通过概述相关框架与机制、展示近场信道估计案例,并探讨未来挑战与研究方向,论证了其在高效获取超维信道状态信息方面的前景。
该论文通过引入嵌入先验并分析提示微调中嵌入坍塌现象,发现模型能在激活空间的不同区域有效工作,且不同任务类型的激活轨迹呈现特定聚类模式,从而为提升提示微调的可解释性、可控性及泛化能力提供了新见解。
该论文提出了一种利用预训练视觉 - 语言模型(VLM)从少量演示中学习抽象符号世界模型的方法,通过自动构建和筛选谓词,使机器人能够在未见过的复杂场景中实现零样本泛化,从而解决长视野的决策规划问题。
本文提出了 UFGraphFR,一种基于用户文本描述特征的联邦推荐框架,该框架通过将私有数据转化为语义向量来在保护隐私的前提下重构全局用户关系图,并结合 Transformer 架构优化个性化行为序列,从而在多个基准数据集上显著提升了推荐精度与个性化水平。
该论文提出了一种基于潜在聚类的数据缩减策略,通过从决策边界附近智能筛选或生成关键样本,在大幅降低半监督对抗训练(SSAT)所需数据量和计算成本的同时,保持了与全量训练相当的鲁棒性。