cs 篇论文 | Gist.Science

Robotic Foundation Models for Industrial Control: A Comprehensive Survey and Readiness Assessment Framework

这篇论文全面综述了机器人基础模型（RFM）的工业适用性，提出了包含 149 项具体标准的评估框架，并通过大规模评估发现当前 RFM 在工业领域的成熟度有限且发展不均衡，强调未来的进步应依赖于将安全、实时性、鲁棒感知及系统集成等要素系统性地纳入可审计的部署堆栈中。

David Kube, Simon Hadwiger, Tobias Meisen2026-03-10💻 cs

XMACNet: An Explainable Lightweight Attention based CNN with Multi Modal Fusion for Chili Disease Classification

本文提出了一种名为 XMACNet 的可解释轻量级注意力 CNN 模型，通过融合可见光图像与植被指数并引入 StyleGAN 数据增强，在辣椒病害分类任务中实现了高精度、强可解释性及边缘部署能力。

Tapon Kumer Ray, Rajkumar Y, Shalini R, Srigayathri K, Jayashree S, Lokeswari P2026-03-10💻 cs

EarthBridge: A Solution for 4th Multi-modal Aerial View Image Challenge Translation Track

本文提出了名为 EarthBridge 的高保真跨模态图像翻译框架，通过结合非马尔可夫桥过程扩散模型与对比无配对学习方法，在第四届多模态航拍图像挑战赛翻译赛道中取得了第二名的优异成绩。

Zhenyuan Chen, Guanyuan Shen, Feng Zhang2026-03-10💻 cs

Gradient-based Nested Co-Design of Aerodynamic Shape and Control for Winged Robots

本文提出了一种基于梯度的嵌套共设计框架，通过结合最优控制规划器与神经代理气动模型，实现了对固定翼滑翔机气动外形与控制策略的联合优化，从而在显著缩短计算时间的同时，有效提升了其在复杂动态任务（如停栖和短距着陆）中的性能。

Daniele Affinita, Mingda Xu, Benoît Valentin Gherardi, Pascal Fua2026-03-10💻 cs

HiDE: Hierarchical Dictionary-Based Entropy Modeling for Learned Image Compression

本文提出了 HiDE 框架，通过构建分层外部先验字典进行级联检索，并结合上下文感知的参数估计网络，有效解决了现有方法中外部先验利用不充分的问题，显著提升了学习式图像压缩的编码效率。

Haoxuan Xiong, Yuanyuan Xu, Kun Zhu, Yiming Wang, Baoliu Ye2026-03-10💻 cs

Efficient Neighbourhood Search in 3D Point Clouds Through Space-Filling Curves and Linear Octrees

该论文提出了一种结合空间填充曲线（Morton 和 Hilbert 曲线）重排序与线性八叉树的高效 3D 点云邻域搜索方法，通过引入 kNN 局部性直方图优化缓存访问，实现了比现有方案快 10 倍的搜索速度及高达 36 倍的并行加速比。

Pablo D. Viñambres, Miguel Yermo, Silvia R. Alcaraz, Oscar G. Lorenzo, Francisco F. Rivera, José C. Cabaleiro2026-03-10💻 cs

Stability-Guided Exploration for Diverse Motion Generation

该论文提出了一种结合 RRT 式搜索、基于采样的模型预测控制以及稳定状态流形采样策略的新方法，旨在通过黑盒仿真引导探索，从而在无需特定任务指导的情况下，为不同机器人形态生成多样化的长程操作策略。

Eckart Cobo-Briesewitz, Tilman Burghoff, Denis Shcherba, Armand Jordana, Marc Toussaint2026-03-10💻 cs

HybridMimic: Hybrid RL-Centroidal Control for Humanoid Motion Mimicking

本文提出了 HybridMimic 框架，通过让学习策略动态预测连续接触状态和期望质心速度来调节基于质心模型的控制器，从而在 Booster T1 人形机器人硬件实验中实现了比现有强化学习基线更低的跟踪误差和更强的动态适应性。

Ludwig Chee-Ying Tay, I-Chia Chang, Yan Gu2026-03-10💻 cs

A Multi-Layer Sim-to-Real Framework for Gaze-Driven Assistive Neck Exoskeletons

该论文提出了一种利用虚拟现实收集眼动数据训练预测模型，并通过从仿真到物理实机的多层级控制器筛选框架，成功开发出需个性化定制的凝视驱动辅助颈外骨骼系统，以解决垂头综合征患者的头部运动支持难题。

Colin Rubow, Eric Brewer, Ian Bales, Haohan Zhang, Daniel S. Brown2026-03-10💻 cs

Breaking the Martingale Curse: Multi-Agent Debate via Asymmetric Cognitive Potential Energy

该论文提出了 AceMAD 框架，通过利用真理持有者能预判群体错误而幻觉多数者无法察觉的认知势能不对称性，将多智能体辩论从易陷入错误共识的“鞅诅咒”随机游走转化为具有正向漂移的定向收敛过程，从而在初始多数意见错误时仍能准确提取稀疏的真实信号。

Yuhan Liu, Juntian Zhang, Yichen Wu, Martin Takac, Salem Lahlou, Xiuying Chen, Nils Lukas2026-03-10💻 cs

A Hybrid Machine Learning Model for Cerebral Palsy Detection

该论文提出了一种结合 VGG19、Efficient-Net 和 ResNet50 提取特征并由 Bi-LSTM 进行分类的混合机器学习模型，用于基于新生儿脑部 MRI 图像早期检测脑瘫，其 98.83% 的准确率优于多个单独使用的预训练模型。

Karan Kumar Singh, Nikita Gajbhiye, Gouri Sankar Mishra2026-03-10💻 cs

Making AI Evaluation Deployment Relevant Through Context Specification

该论文针对当前 AI 评估方法难以反映实际运营现状的问题，提出了“情境规范”（context specification）这一流程，旨在将模糊的利益相关者视角转化为明确的可测量构念，从而为组织在真实部署环境中制定明智的 AI 决策和评估提供基础路线图。

Matthew Holmes, Thiago Lacerda, Reva Schwartz2026-03-10💻 cs

Reinforcing the World's Edge: A Continual Learning Problem in the Multi-Agent-World Boundary

该论文指出，在去中心化多智能体强化学习中，由于将同伴策略纳入世界边界会引发非平稳性，导致跨回合的不变决策核心（Invariant Core）可能收缩或消失，从而将此类问题重新定义为一种源于“智能体 - 世界”边界漂移的持续学习挑战。

Dane Malenfant2026-03-10💻 cs

AI-Assisted Curation of Conference Scholarship: Compiling, Structuring, and Analyzing Two Decades of Presentations at the Society for Social Work and Research

本研究利用人工智能辅助技术，构建了涵盖 2005 至 2026 年社会社会工作与研究学会（SSWR）会议近 2.4 万篇摘要的数据库，揭示了该领域在作者协作、国际参与度及研究方法（以定量为主）等方面的显著演变趋势。

Brian Perron, Bryan Victor, Zia Qi2026-03-10💻 cs

A Comprehensive Analysis of the Effects of Network Quality of Service on Robotic Telesurgery

该论文通过引入新型网络故障注入工具 NetFI 并结合包含 15 名受试者的用户研究，系统分析了丢包、延迟和通信中断等网络服务质量因素对不同熟练度外科医生执行远程手术任务性能、运动原语及主观工作负荷的具体影响，从而为确定远程手术的操作边界及开发鲁棒控制策略提供了量化依据。

Zhaomeng Zhang, Seyed Hamid Reza Roodabeh, Homa Alemzadeh2026-03-10💻 cs

Step-Level Visual Grounding Faithfulness Predicts Out-of-Distribution Generalization in Long-Horizon Vision-Language Models

该论文揭示了一种长程视觉语言模型的行为规律，即模型在推理过程中保持与视觉状态一致的时间锚定能力（通过步级接地率 SGR 衡量），是预测其分布外泛化性能的关键指标，且该能力独立于模型规模和最终答案准确率。

Md Ashikur Rahman, Md Arifur Rahman, Niamul Hassan Samin, Abdullah Ibne Hanif Arean, Juena Ahmed Noshin2026-03-10💻 cs

cs