cs 篇论文 | Gist.Science

CAR: Cross-Vehicle Kinodynamics Adaptation via Mobility Representation

本文提出了名为 CAR 的跨车辆运动动力学适应框架，该框架利用 Transformer 编码器和自适应层归一化将不同车辆（从轮式到履带式）的轨迹与物理配置映射至共享潜在空间，从而仅需极少量新数据即可实现对新车辆平台的快速运动动力学迁移与预测。

Tong Xu, Chenhui Pan, Xuesu Xiao2026-03-10💻 cs

LEAD: Breaking the No-Recovery Bottleneck in Long-Horizon Reasoning

该论文提出了一种名为 LEAD 的展望增强原子分解方法，通过引入短视野未来验证和重叠推演聚合，解决了长程推理中因极端分解导致的“不可恢复瓶颈”问题，显著提升了大模型在复杂算法任务中的稳定性与求解能力。

Denys Pushkin, Emmanuel Abbe2026-03-10💻 cs

PICS: Pairwise Image Compositing with Spatial Interactions

本文提出了 PICS，一种通过并行组合对象并显式建模空间交互的自监督图像合成范式，利用掩码引导的混合专家交互 Transformer 和自适应融合策略，有效解决了扩散模型在成对或序列编辑中空间关系不一致及内容覆盖的问题，并在虚拟试衣、室内及街景等场景中显著提升了合成质量与稳定性。

Hang Zhou, Xinxin Zuo, Sen Wang, Li Cheng2026-03-10💻 cs

Not Too Short, Not Too Long: How LLM Response Length Shapes People's Critical Thinking in Error Detection

该研究通过实验发现，大语言模型回答的长度会调节用户对错误推理的识别能力，其中在模型推理错误时，中等长度的解释比过短或过长的解释更能帮助用户保持批判性判断的准确性。

Natalie Friedman, Adelaide Nyanyo, Kevin Weatherwax, Lifei Wang, Chengchao Zhu, Zeshu Zhu, S. Joy Mountford2026-03-10💻 cs

Material Driven HRI Design: Aesthetics as Explainability

该论文提出了一种将材料美学视为可解释性信号的设计框架，主张通过色彩、纹理和材质选择来引导人机交互预期、明确机器人角色并提升其可理解性，并通过内容分析验证了这一方法。

Natalie Friedman, Kevin Weatherwax, Chengchao Zhu2026-03-10💻 cs

Notational Animating: An Interactive Approach to Creating and Editing Animation Keyframes

本文提出了“记号动画”这一交互范式，通过让用户在静态绘图上绘制表达运动意图的高层记号，结合形式化表示、自动关键帧生成及动态反馈机制，实现高效且灵活的动画创作与编辑。

Xinyu Shi, Li-Yi Wei, Nanxuan Zhao, Jian Zhao, Rubaiat Habib Kazi2026-03-10💻 cs

Distributed Legal Infrastructure for a Trustworthy Agentic Web

该论文针对人工智能代理主导的“代理网络”对现有法律框架带来的挑战，提出了一种由自主身份、认知约束、去中心化裁决、自下而上的市场规制及可移植制度框架五层构成的分布式法律基础设施（DLI）治理范式，旨在通过互操作协议将合法性嵌入技术底层，从而在去中心化环境中实现可问责、可争议且符合法治原则的治理。

Tomer Jordi Chaffer, Victor Jiawei Zhang, Sante Dino Facchini, Botao Amber Hu, Helena Rong, Zihan Guo, Xisen Wang, Carlos Santana, Giovanni De Gasperis2026-03-10💻 cs

OPTED: Open Preprocessed Trachoma Eye Dataset Using Zero-Shot SAM 3 Segmentation

本文介绍了利用零样本 SAM 3 模型构建的开源预处理沙眼数据集 OPTED，该数据集通过自动化四步流水线从原始临床图像中提取感兴趣区域，旨在解决撒哈拉以南非洲地区缺乏高质量预训练数据的问题，以推动沙眼自动分类研究。

Kibrom Gebremedhin, Hadush Hailu, Bruk Gebregziabher2026-03-10💻 cs

VertiAdaptor: Online Kinodynamics Adaptation for Vertically Challenging Terrain

本文提出了一种名为 VertiAdaptor 的在线适应框架，通过融合高程与语义嵌入信息并利用神经常微分方程基函数，实现了非结构化越野环境中车辆运动动力学的快速自适应建模与规划，从而显著提升了预测精度与适应速度。

Tong Xu, Chenhui Pan, Aniket Datar, Xuesu Xiao2026-03-10💻 cs

Enhancing the Detection of Coronary Artery Disease Using Machine Learning

该研究通过训练双向长短期记忆网络（Bi-LSTM）、门控循环单元（GRU）及其混合模型，利用临床特征、影像和生物标志物数据成功将冠状动脉疾病检测准确率提升至 97.07%，显著优于传统诊断方法。

Karan Kumar Singh, Nikita Gajbhiye, Gouri Sankar Mishra2026-03-10💻 cs

SoK: Self-Sovereign Digital Identities

本文通过对 80 份文献的系统化梳理和 12 个实际应用的评估，全面总结了自主权数字身份（SSDI）的研究现状，识别出阻碍其落地的六大核心挑战，并指出当前研究过度集中于区块链方案且实际自主权呈现为光谱而非二元属性，旨在推动该领域向更成熟的方向发展。

Sushanth Ambati, Kainat Adeel, Jack Myers, Nikolay Ivanov2026-03-10💻 cs

Collaborative Planning with Concurrent Synchronization for Operationally Constrained UAV-UGV Teams

本文提出了一种名为 CoPCS 的基于学习的协同规划方法，通过结合异构图 Transformer 与 Transformer 解码器，实现了受能量和地形约束的无人机与无人车团队在任务执行过程中的同步并发协同规划，从而显著提升了团队在复杂大规模任务中的整体性能。

Zihao Deng, Qianhuang Li, Peng Gao, Maggie Wigness, John Rogers, Donghyun Kim, Hao Zhang2026-03-10💻 cs

Empowering Locally Deployable Medical Agent via State Enhanced Logical Skills for FHIR-based Clinical Tasks

该论文提出了一种名为 SELSM 的免训练框架，通过蒸馏模拟临床轨迹为实体无关的逻辑规则，并利用查询锚定的两阶段检索机制解决状态多义性问题，从而在严格隐私约束下显著提升了本地部署的 30B 级医疗大模型在 FHIR 临床任务中的零-shot 推理能力与任务完成率。

Wanrong Yang, Zhengliang Liu, Yuan Li, Bingjie Yan, Lingfang Li, Mingguang He, Dominik Wojtczak, Yalin Zheng, Danli Shi2026-03-10💻 cs

SysNav: Multi-Level Systematic Cooperation Enables Real-World, Cross-Embodiment Object Navigation

本文提出了名为 SysNav 的三级系统化协作框架，通过解耦语义推理、导航规划与运动控制，成功实现了在轮式、四足及人形等多种实体上跨形态、长距离的复杂现实环境物体导航，并在真实世界实验与仿真基准测试中取得了显著的性能提升。

Haokun Zhu, Zongtai Li, Zihan Liu, Kevin Guo, Zhengzhi Lin, Yuxin Cai, Guofei Chen, Chen Lv, Wenshan Wang, Jean Oh, Ji Zhang2026-03-10💻 cs

PaQ-DETR: Learning Pattern and Quality-Aware Dynamic Queries for Object Detection

PaQ-DETR 提出了一种统一框架，通过基于内容条件加权的共享潜在模式动态生成查询，并结合质量感知的多对一分配策略，有效解决了 DETR 系列模型中查询利用不平衡的问题，从而在多个基准测试中显著提升了检测精度。

Zhengjian Kang, Jun Zhuang, Kangtong Mo, Qi Chen, Rui Liu, Ye Zhang2026-03-10💻 cs

T2Nav Algebraic Topology Aware Temporal Graph Memory and Loop Detection for ZeroShot Visual Navigation

本文提出了 T2Nav，一种结合代数拓扑感知时序图记忆与零样本视觉导航的框架，通过融合异构数据与图推理，实现了在未知环境中无需额外训练即可进行鲁棒避障、可靠回环检测及高效路径规划的能力。

Quang-Anh N. D., Duc Pham, Minh-Anh Nguyen, Tung Doan, Tuan Dang2026-03-10💻 cs

SurgSync: Time-Synchronized Multi-Modal Data Collection Framework and Dataset for Surgical Robotics

本文提出了名为 SurgSync 的多模态手术机器人数据采集框架与数据集，该框架基于 da Vinci 研究套件，集成了在线/离线同步录制、高清立体内窥镜及新型接触传感器，并通过包含 214 个验证实例的离体组织实验，为手术机器人的智能训练与技能评估提供了高质量数据支持。

Haoying Zhou, Chang Liu, Yimeng Wu, Junlin Wu, Zijian Wu, Yu Chung Lee, Sara Martuscelli, Spetimiu E. Salcudean, Gregory S. Fischer, Peter Kazanzides2026-03-10💻 cs

DLRMamba: Distilling Low-Rank Mamba for Edge Multispectral Fusion Object Detection

本文提出了一种名为 DLRMamba 的轻量化模型，通过引入低秩二维选择性状态空间模块（Low-Rank SS2D）和结构感知蒸馏策略，有效解决了现有 Mamba 模型在边缘设备上进行多光谱融合目标检测时的参数冗余与细粒度信息丢失问题，实现了在资源受限硬件上效率与精度的显著平衡。

Qianqian Zhang, Leon Tabaro, Ahmed M. Abdelmoniem, Junshe An2026-03-10💻 cs

LIPP: Load-Aware Informative Path Planning with Physical Sampling

本文提出了负载感知信息路径规划（LIPP）框架，通过建立混合整数二次规划模型，将物理采样带来的负载增加与能耗耦合纳入考量，从而在能量预算约束下实现比传统信息路径规划更优的采样效率与不确定性降低。

Hojune Kim, Guangyao Shi, Gaurav S. Sukhatme2026-03-10💻 cs

Small Target Detection Based on Mask-Enhanced Attention Fusion of Visible and Infrared Remote Sensing Images

本文提出了一种名为 ESM-YOLO+ 的轻量级可见光与红外遥感图像融合网络，通过引入掩码增强注意力融合模块和训练时结构表征增强技术，在显著降低模型复杂度的同时，有效解决了复杂背景下小目标检测的难题并实现了高精度性能。

Qianqian Zhang, Xiaolong Jia, Ahmed M. Abdelmoniem, Li Zhou, Junshe An2026-03-10💻 cs