cs 篇论文 | Gist.Science

Stable Multi-Drone GNSS Tracking System for Marine Robots

本文提出了一种结合高效视觉检测、轻量级多目标跟踪、GNSS 三角测量及置信度加权扩展卡尔曼滤波的多无人机系统，通过跨无人机 ID 对齐算法实现了海洋机器人在水面及近水面环境下的稳定、实时且高精度的全局跟踪。

Shuo Wen, Edwin Meriaux, Mariana Sosa Guzmán, Zhizun Wang, Junming Shi, Gregory Dudek2026-03-10💻 cs

Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion

本文提出了 Yo'City，一种利用大模型推理与组合能力的智能体框架，通过“城市 - 街区 - 网格”分层规划、基于自批评的图像合成循环以及关系引导的扩展机制，实现了个性化且无限可扩展的逼真 3D 城市场景生成。

Keyang Lu, Sifan Zhou, Hongbin Xu, Gang Xu, Zhifei Yang, Yikai Wang, Zhen Xiao, Jieyi Long, Ming Li2026-03-10💻 cs

DOPD: A Dynamic PD-Disaggregation Architecture for Maximizing Goodput in LLM Inference Serving

本文提出了 DOPD 系统，通过基于实时负载监控动态调整预填充与解码实例的比例，有效解决了 LLM 推理服务中的资源失衡问题，从而在显著降低延迟的同时将整体系统吞吐量提升了最高 1.5 倍。

Junhan Liao, Minxian Xu, Wanyi Zheng, Yan Wang, Kejiang Ye, Rajkumar Buyya, Chengzhong Xu2026-03-10💻 cs

Sublinear Edge Fault Tolerant Spanners for Hypergraphs

本文首次研究了超图中的容错 spanner 问题，提出了一种基于聚类的算法以构建次线性大小的边容错超 spanner，并建立了相应的下界，填补了该领域在容错设置下从线性到次线性规模的关键空白。

Jialin He, Nicholas Popescu, Chunjiang Zhu2026-03-10💻 cs

An LLM-Assisted Multi-Agent Control Framework for Roll-to-Roll Manufacturing Systems

本文提出了一种由大语言模型辅助的多智能体控制框架，通过系统识别、自动调参、安全验证及持续监测等五个阶段，实现了卷对卷制造系统中控制设计的自动化与自适应，在显著降低人工调试成本的同时确保了张力与速度控制的精度及安全性。

Jiachen Li, Shihao Li, Christopher Martin, Zijun Chen, Dongmei Chen, Wei Li2026-03-10💻 cs

RadDiff: Retrieval-Augmented Denoising Diffusion for Protein Inverse Folding

本文提出了一种名为 RadDiff 的新型检索增强去噪扩散模型，通过引入检索增强机制和知识感知模块来有效整合外部蛋白质知识，从而在蛋白质逆折叠任务中显著提升了序列恢复率和可折叠性，并克服了现有方法在知识利用和扩展性方面的局限。

Jin Han, Tianfan Fu, Wu-Jun Li2026-03-10💻 cs

Integrating a Causal Foundation Model into a Prescriptive Maintenance Framework for Optimising Production-Line OEE

本文提出了一种基于因果基础模型的预测性维护框架，通过模拟干预措施来量化其对整体设备效率（OEE）的因果影响，从而帮助工程师识别根本原因并优化生产线的决策。

Felix Saretzky, Lucas Andersen, Thomas Engel, Fazel Ansari2026-03-10💻 cs

S2AM3D: Scale-controllable Part Segmentation of 3D Point Cloud

本文提出了 S2AM3D 框架，通过结合 2D 分割先验与 3D 一致性监督，利用点一致部分编码器和尺度感知提示解码器解决了现有 3D 点云部件分割中泛化性差和视图不一致的问题，并发布了大规模数据集以实现具有卓越鲁棒性和粒度可控性的分割性能。

Han Su, Tianyu Huang, Zichen Wan, Xiaohe Wu, Wangmeng Zuo2026-03-10💻 cs

Confidential, Attestable, and Efficient Inter-CVM Communication with Arm CCA

本文介绍了基于 Arm CCA 架构的 CAEC 系统，通过引入对 Hypervisor 不可见的机密共享内存（CSM）机制，在保持强隔离与可证明性的同时，显著解决了 CVM 间通信的性能瓶颈问题。

Sina Abdollahi, Amir Al Sadi, Marios Kogias, David Kotz, Hamed Haddadi2026-03-10💻 cs

HiconAgent: History Context-aware Policy Optimization for GUI Agents

本文提出了 HiconAgent，一种通过动态上下文采样和锚点引导的历史压缩策略来优化历史上下文利用的 GUI 智能体，在显著降低计算成本的同时实现了优于更大规模模型的性能。

Xurui Zhou, Gongwei Chen, Yuquan Xie, Zaijing Li, Kaiwen Zhou, Shuai Wang, Shuo Yang, Zhuotao Tian, Rui Shao2026-03-10💻 cs

MAViD: A Multimodal Framework for Audio-Visual Dialogue Understanding and Generation

本文提出了 MAViD 框架，通过“指挥者 - 创作者”架构及结合自回归与扩散模型的双 DiT 结构，实现了能够生成身份、音色和语调一致且长时连贯的生动音视频对话交互。

Youxin Pang, Jiajun Liu, Lingfeng Tan, Yong Zhang, Feng Gao, Xiang Deng, Zhuoliang Kang, Xiaoming Wei, Yebin Liu2026-03-10💻 cs

When Token Pruning is Worse than Random: Understanding Visual Token Information in VLLMs

该论文揭示了视觉大语言模型深层中存在“信息视界”现象，即视觉令牌信息随层数加深而逐渐均匀化直至消失，导致深层训练无关剪枝效果不优于随机剪枝，进而提出在深层结合随机剪枝的策略，在大幅降低计算成本的同时保持了模型的高性能。

Yahong Wang, Juncheng Wu, Zhangkai Ni, Longzhen Yang, Yihang Liu, Chengmei Yang, Ying Wen, Lianghua He, Xianfeng Tang, Hui Liu, Yuyin Zhou2026-03-10💻 cs

IPPO Learns the Game, Not the Team: A Study on Generalization in Heterogeneous Agent Teams

该研究利用 HeMAC 环境发现，尽管缺乏多样化队友的训练，基于参数共享的 IPPO 基准方法在异构多智能体设置中仍能展现出与引入旋转策略训练（RPT）相当的泛化能力，表明其已习得基于游戏本质的通用协作策略而非过度拟合特定队友行为。

Ryan LeRoy, Jack Kolb2026-03-10💻 cs

Beyond Endpoints: Path-Centric Reasoning for Vectorized Off-Road Network Extraction

本文针对非结构化野外环境下的矢量路网提取难题，发布了大规模数据集 WildRoad 并提出了基于路径推理的 MaGRoad 框架，通过聚合多尺度视觉证据有效克服了现有节点中心方法的局限性，在显著提升野外场景拓扑精度的同时实现了更快的推理速度。

Wenfei Guan, Jilin Mei, Tong Shen, Xumin Wu, Shuo Wang, Chen Min, Yu Hu2026-03-10💻 cs

ReMeDI: Refined Memory for Disambiguation of Identities with SAM3 in Surgical Segmentation

本文提出了无需训练的 ReMeDI-SAM3 方法，通过引入相关性感知记忆过滤、分段插值扩展及基于特征的时序投票重识别模块，有效解决了 SAM3 在手术视频分割中因频繁遮挡和长时重入导致的身份混淆问题，并在多个数据集上实现了超越现有训练方法的零样本性能提升。

Valay Bundele, Mehran Hosseinzadeh, Hendrik P. A. Lensch2026-03-10💻 cs

It is not always greener on the other side: Greenery perception across demographics and personalities in multiple cities

该研究通过分析来自五个国家的 1000 名受访者的街景图像与主观感知数据，发现人口统计学特征和个性对绿视感知影响甚微，而居住地点（反映文化、环境及经验因素）是解释客观绿量与主观感知差异的最关键因素。

Matias Quintana, Fangqi Liu, Jussi Torkko, Youlong Gu, Xiucheng Liang, Yujun Hou, Koichi Ito, Yihan Zhu, Mahmoud Abdelrahman, Tuuli Toivonen, Yi Lu, Filip Biljecki2026-03-10💻 cs

VOIC: Visible-Occluded Integrated Guidance for 3D Semantic Scene Completion

该论文针对单目 3D 语义场景补全中可见区域感知与遮挡区域推理相互干扰的问题，提出了一种通过离线可见区域标签提取策略分离监督信号，并采用可见 - 遮挡双解码器架构进行显式解耦与协同推理的 VOIC 方法，在多个基准测试中实现了最先进的性能。

Zaidao Han, Risa Higashita, Jiang Liu2026-03-10💻 cs

Cost Trade-offs of Reasoning and Non-Reasoning Large Language Models in Text-to-SQL

该论文通过基于 Google BigQuery 的大规模实证研究，揭示了推理与非推理大语言模型在 Text-to-SQL 任务中的成本权衡，指出执行时间与云计费成本弱相关，且非推理模型因缺乏分区过滤等优化会导致高达 3.4 倍的成本波动，从而为企业部署提供了降低财务风险的关键指导。

Saurabh Deochake, Debajyoti Mukhopadhyay2026-03-10💻 cs

NashOpt -- A Python Library for Computing Generalized Nash Equilibria

NashOpt 是一个开源 Python 库，利用 JAX 自动微分和混合整数线性规划等技术，通过联合 KKT 条件高效求解非线性及线性二次广义纳什均衡，并支持逆博弈与斯塔克尔伯格博弈设计问题。

Alberto Bemporad2026-03-10💻 cs

Toward a Physical Theory of Intelligence

本文提出了“守恒一致编码”（CCE）框架，将智能视为受守恒律约束的物理过程，通过推广兰道尔原理和 metriplectic 流，建立了连接热力学耗散、量子测量与宏观时空几何的统一理论，从而为理解自然与人工智能提供了物理约束和量化指标。

Peter David Fagan2026-03-10💻 cs