Almost-Optimal Upper and Lower Bounds for Clustering in Low Dimensional Euclidean Spaces

该论文将低维欧几里得空间中kk-中值和kk-均值问题的(1+ε)(1+\varepsilon)-近似算法运行时间从$2^{(1/\varepsilon)^{O(d^2)}}n改进至改进至2^{\tilde{O}(1/\varepsilon)^{d-1}}n,并在GapETH假设下证明了该指数依赖维度,并在Gap-ETH假设下证明了该指数依赖维度d-1$的下界,从而确立了近乎紧致的复杂度界限。

Vincent Cohen-Addad, Karthik C. S., David Saulpic, Chris Schwiegelshohn2026-03-11💻 cs

The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation

该论文提出了一种名为“能力一致性系统”(CCS)的新框架,通过将内存一致性模型(如 MESI)映射到身份授权场景,证明了基于发布一致性(RCC)的撤销策略在高速代理执行环境中能将未授权操作数量从时间依赖的线性增长降低至与代理速度无关的常数级,从而在根本上解决了传统基于时间窗口的访问控制机制在大规模并发下的安全性失效问题。

Vladyslav Parakhin2026-03-11💻 cs

InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing

本文提出了轻量级统一多模态模型 InternVL-U,通过解耦视觉表征与推理中心的数据合成策略,在仅使用 40 亿参数的情况下实现了理解、推理、生成与编辑能力的统一,其综合性能显著超越了参数量大 3 倍以上的同类基线模型。

Changyao Tian, Danni Yang, Guanzhou Chen, Erfei Cui, Zhaokai Wang, Yuchen Duan, Penghao Yin, Sitao Chen, Ganlin Yang, Mingxin Liu, Zirun Zhu, Ziqian Fan, Leyao Gu, Haomin Wang, Qi Wei, Jinhui Yin, Xue Yang, Zhihang Zhong, Qi Qin, Yi Xin, Bin Fu, Yihao Liu, Jiaye Ge, Qipeng Guo, Gen Luo, Hongsheng Li, Yu Qiao, Kai Chen, Hongjie Zhang2026-03-11💻 cs

DISPLAY: Directable Human-Object Interaction Video Generation via Sparse Motion Guidance and Multi-Task Auxiliary

该论文提出了 DISPLAY 框架,通过仅依赖手腕关节坐标和物体边界框的稀疏运动引导、物体感知注意力机制以及多任务辅助训练策略,实现了高保真且可灵活控制的人与物体交互视频生成。

Jiazhi Guan, Quanwei Yang, Luying Huang, Junhao Liang, Borong Liang, Haocheng Feng, Wei He, Kaisiyuan Wang, Hang Zhou, Jingdong Wang2026-03-11💻 cs

Robust Cooperative Localization in Featureless Environments: A Comparative Study of DCL, StCL, CCL, CI, and Standard-CL

本文通过在 ROS 中实现并对比五种协作定位算法(CCL、DCL、StCL、CI 和 Standard-CL)在弱数据关联与鲁棒检测条件下的蒙特卡洛仿真,揭示了各方法在精度与一致性之间的权衡,指出 CI 算法在保持竞争力的同时实现了最佳平衡,而 StCL 和 Standard-CL 虽精度最高但存在严重不一致性,DCL 则因隐式正则化机制在挑战性条件下表现出卓越的稳定性。

Nivand Khosravi, Meysam Basiri, Rodrigo Ventura2026-03-11💻 cs

Stepping VLMs onto the Court: Benchmarking Spatial Intelligence in Sports

本文提出了首个面向体育场景的大规模空间智能数据集 CourtSI 及其基准测试 CourtSI-Bench,通过利用球场几何结构构建百万级问答数据,揭示了现有视觉语言模型在体育空间推理上的局限性,并验证了基于该数据微调模型可显著提升其在空间理解与评论生成方面的性能。

Yuchen Yang, Yuqing Shao, Duxiu Huang, Linfeng Dong, Yifei Liu, Suixin Tang, Xiang Zhou, Yuanyuan Gao, Wei Wang, Yue Zhou, Xue Yang, Yanfeng Wang, Xiao Sun, Zhihang Zhong2026-03-11💻 cs

Fine-grained Motion Retrieval via Joint-Angle Motion Images and Token-Patch Late Interaction

该论文提出了一种基于关节角运动图像与 Token-Patch 晚期交互的可解释细粒度文本 - 动作检索方法,通过将局部关节特征映射为伪图像并结合掩码语言模型正则化,克服了现有全局嵌入方法在细粒度对应和可解释性上的不足,在 HumanML3D 和 KIT-ML 数据集上实现了超越最先进水平的检索性能。

Yao Zhang, Zhuchenyang Liu, Yanlan He, Thomas Ploetz, Yu Xiao2026-03-11💻 cs

Leveraging whole slide difficulty in Multiple Instance Learning to improve prostate cancer grading

该论文提出了一种基于专家与非专家病理学家诊断分歧的“全切片难度”(WSD)概念,并通过多任务学习和加权分类损失两种方法将其融入前列腺癌 Gleason 分级任务中,实验结果表明该方法能显著提升不同特征编码器和多实例学习模型的性能,尤其改善了对高 Gleason 分级(即更严重病情)的分类效果。

Marie Arrivat, Rémy Peyret, Elsa Angelini, Pietro Gori2026-03-11💻 cs

Kinodynamic Motion Retargeting for Humanoid Locomotion via Multi-Contact Whole-Body Trajectory Optimization

本文提出了名为 KDMR 的框架,通过将人形机器人运动重定向建模为多接触全身轨迹优化问题,并显式结合刚体动力学与地面反作用力数据,有效解决了传统纯运动学方法导致的物理不一致性问题,从而生成了动力学可行且平滑的参考轨迹,显著提升了下游模仿学习策略的训练效率与 locomotion 稳定性。

Xiaoyu Zhang, Steven Haener, Varun Madabushi, Maegan Tucker2026-03-11💻 cs