Supervised Metric Regularization Through Alternating Optimization for Multi-Regime Physics-Informed Neural Networks

本文提出了一种名为 TAPINN 的拓扑感知物理信息神经网络,通过监督度量正则化构建潜在空间并采用交替优化策略,有效解决了参数化动力学系统中因谱偏差导致的模态崩溃问题,在显著降低物理残差和梯度方差的同时,以比超网络方案少 5 倍的参数量实现了更稳定的收敛。

Enzo Nicolas Spotorno, Josafat Ribeiro Leal, Antonio Augusto Frohlich2026-03-06🔬 physics

Empirical Stability Analysis of Kolmogorov-Arnold Networks in Hard-Constrained Recurrent Physics-Informed Discovery

本文实证研究了将 Kolmogorov-Arnold 网络(KAN)集成到硬约束循环物理信息架构中,发现尽管 KAN 在处理单变量多项式残差时具有一定竞争力,但其在深层配置中表现出严重的超参数脆弱性和不稳定性,且在处理乘法项(如范德波尔系统)时表现不如标准 MLP,揭示了原始 KAN 公式中加法归纳偏置在状态耦合方面的局限性。

Enzo Nicolas Spotorno, Josafat Leal Filho, Antonio Augusto Medeiros Frohlich2026-03-06🔬 physics

Pailitao-VL: Unified Embedding and Reranker for Real-Time Multi-Modal Industrial Search

本文提出了 Pailitao-VL,一种专为高精度实时工业搜索设计的统一多模态检索系统,通过引入基于绝对 ID 识别的嵌入范式及对比校准的列表式重排序策略,有效解决了现有方案在检索粒度、环境噪声鲁棒性及效率性能平衡方面的关键挑战,并在阿里巴巴电商平台上实现了业界领先的性能与显著的业务价值。

Lei Chen, Chen Ju, Xu Chen + 13 more2026-03-06💻 cs

Assessing Risks of Large Language Models in Mental Health Support: A Framework for Automated Clinical AI Red Teaming

该论文提出了一种结合动态认知情感模型与临床风险本体的自动化红队测试框架,通过大规模模拟实验揭示了当前大语言模型在心理健康支持中存在验证患者妄想及未能有效干预自杀风险等严重安全隐患,并验证了该框架在帮助多方利益相关者审计 AI 心理治疗“黑箱”方面的有效性。

Ian Steenstra, Paola Pedrelli, Weiyan Shi + 2 more2026-03-06💻 cs

Interpretable Multimodal Gesture Recognition for Drone and Mobile Robot Teleoperation via Log-Likelihood Ratio Fusion

本文提出了一种结合 Apple Watch 惯性数据与定制手套电容信号的基于对数似然比融合的可解释多模态手势识别框架,并发布了包含 20 种手势的新数据集,该方案在保持与视觉基线相当性能的同时,显著降低了计算成本与模型规模,有效提升了无人机和移动机器人在危险环境下的遥操作鲁棒性。

Seungyeol Baek, Jaspreet Singh, Lala Shakti Swarup Ray + 3 more2026-03-06💻 cs

Dr. Seg: Revisiting GRPO Training for Visual Large Language Models through Perception-Oriented Design

本文针对将 GRPO 从语言推理迁移至视觉感知任务时存在的假设误区,提出了无需架构修改的 Dr. Seg 框架,通过引入“观察确认”机制和分布排序奖励模块,有效解决了输出空间不足与奖励细粒度不稳定问题,显著提升了视觉大语言模型在复杂场景下的表现。

Haoxiang Sun, Tao Wang, Chenwei Tang + 2 more2026-03-06💻 cs

AlignVAR: Towards Globally Consistent Visual Autoregression for Image Super-Resolution

本文提出了 AlignVAR 框架,通过引入空间一致性自回归(SCA)和分层一致性约束(HCC)两大核心组件,有效解决了视觉自回归模型在图像超分辨率任务中面临的局部偏差与误差累积问题,在显著提升全局一致性与感知质量的同时,实现了比主流扩散方法快 10 倍且参数量减少近 50% 的高效推理。

Cencen Liu, Dongyang Zhang, Wen Yin + 6 more2026-03-06💻 cs