cs.AI 篇论文 | Gist.Science

UniCast: A Unified Framework for Instance-Conditioned Multimodal Time-Series Forecasting

本文提出了 UniCast，一种通过实例条件提示和动态模态路由机制，在冻结的时间序列基础模型上实现参数高效的多模态融合与实例自适应预测的统一框架。

Sehyuk Park, Soyeon Caren Han, Eduard Hovy2026-03-10💻 cs

ECHO: Frequency-aware Hierarchical Encoding for Variable-length Signals

本文提出了名为 ECHO 的新型基础模型，通过融合频带分割架构与频率位置编码，实现了对任意采样率和可变长度机器信号（如声学、振动及工业传感器数据）的高效建模，并在异常检测与故障分类任务中取得了领先性能。

Yucong Zhang, Juan Liu, Ming Li2026-03-10🤖 cs.LG

Entropy-Driven Curriculum for Multi-Task Training in Human Mobility Prediction

该论文提出了一种融合熵驱动课程学习与多任务学习的统一框架，通过基于 Lempel-Ziv 压缩的轨迹可预测性量化实现由简入繁的训练，并联合优化位置、距离及方向预测，从而在 HuMob 挑战赛中实现了状态最先进的人体移动预测性能与显著加速的收敛速度。

Tianye Fang, Xuanshu Luo, Martin Werner2026-03-10🤖 cs.LG

Improving the Resilience of Quadrotors in Underground Environments by Combining Learning-based and Safety Controllers

本文提出了一种结合基于学习的控制器与安全控制器的混合方法，通过利用归一化流模型构建环境先验来实时监测分布外状态，从而在确保地下洞穴环境中飞行安全的同时，实现了快速自主导航。

Isaac Ronald Ward, Mark Paral, Kristopher Riordan + 1 more2026-03-10⚡ eess

OTESGN: Optimal Transport-Enhanced Syntactic-Semantic Graph Networks for Aspect-Based Sentiment Analysis

本文提出了 OTESGN 模型，通过结合句法图感知注意力与基于最优传输的语义注意力机制，有效解决了传统方法在捕捉非线性关联和抗噪方面的不足，从而在多个基准数据集上实现了方面级情感分析的最优性能。

Xinfeng Liao, Xuanqi Chen, Lianxi Wang, Jiahuan Yang, Zhuowei Chen, Ziying Rong2026-03-10💬 cs.CL

Classification of Driver Behaviour Using External Observation Techniques for Autonomous Vehicles

该研究提出了一种基于外部视觉观察和计算机视觉技术（如 YOLO 目标检测与车道监测）的新型驾驶员行为分类系统，旨在无需车载通信即可实时识别分心或受 impaired 驾驶等不安全行为，从而提升自动驾驶环境下的道路安全。

Ian Nell, Shane Gilroy2026-03-10⚡ eess

Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

本文提出了一种基于生成式人工智能的模块化多模态框架，利用公开图像和住宅信息合成逼真的建筑参数数据，从而解决建筑能耗研究中数据获取成本高、隐私受限等问题，并支持从单体建筑到区域尺度的能源模拟研究。

Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra2026-03-10🤖 cs.LG

MICA: Multi-Agent Industrial Coordination Assistant

本文提出了 MICA（多智能体工业协调助手），这是一个在受限计算与隐私约束下运行的感知驱动、语音交互系统，它通过五个角色专用智能体与自适应步骤融合技术，为工业装配、故障排查等任务提供实时、安全且可靠的指导，并建立了相应的评估基准以验证其优越性。

Di Wen, Kunyu Peng, Junwei Zheng, Yufan Chen, Yitian Shi, Jiale Wei, Ruiping Liu, Kailun Yang, Rainer Stiefelhagen2026-03-10🤖 cs.LG

Compose by Focus: Scene Graph-based Atomic Skills

本文提出了一种基于场景图的原子技能学习框架，通过聚焦任务相关对象与关系来缓解分布偏移，并结合扩散模型与视觉语言规划器，显著提升了通用机器人在长程复杂任务中的执行鲁棒性与组合泛化能力。

Han Qi, Changhe Chen, Heng Yang2026-03-10💻 cs

Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation

本文提出了名为 FINS 的轻量级框架，通过结合多分辨率哈希网格编码器与预训练基础模型，实现了仅需单张 RGB 图像即可在数秒内高效重建高保真隐式表面及 SDF 场，并在收敛速度、重建精度及机器人表面跟随任务中优于现有最先进方法。

Wei-Teng Chu, Tianyi Zhang, Matthew Johnson-Roberson, Weiming Zhi2026-03-10💻 cs

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

该研究发现，线性探针严重依赖文本证据（如系统提示或思维链），一旦过滤掉这些表面文本信息，其在检测沙袋行为、阿谀奉承和偏见等潜在有害行为时的性能会显著下降，表明此类探针在识别非表层模式时存在脆弱性。

Gerard Boxo, Aman Neelappa, Shivam Raval2026-03-10🤖 cs.LG

Towards Strategic Persuasion with Language Models

本文基于贝叶斯说服理论构建了一个可扩展的评估与训练框架，利用强化学习使大语言模型（包括小模型）能够掌握复杂的战略说服策略并显著提升说服效果。

Zirui Cheng, Jiaxuan You2026-03-10💻 cs

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

本文提出了生成式进化元求解器（GEMS），这是一种无需代理的框架，它利用潜在锚点和单一生成器替代显式策略种群，在保留博弈论保证的同时显著降低了计算与内存开销，从而实现了可扩展的多智能体强化学习。

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

Mapping Overlaps in Benchmarks through Perplexity in the Wild

该论文提出了基于野外语料库中显著词元困惑度的“基准签名”方法，通过跨 32 个大模型和 89 个基准的元评估，揭示了不同基准间在知识与推理任务上的深层重叠、在文化与人文领域的低相似性，以及编码任务的高度独立性，从而为理解大模型能力景观及基准有效性提供了超越传统性能相关性的新视角。

Siyang Wu, Honglin Bao, Sida Li, Ari Holtzman, James A. Evans2026-03-10💬 cs.CL

ELHPlan: Efficient Long-Horizon Task Planning for Multi-Agent Collaboration

本文提出了 ELHPlan 框架，通过引入“意图绑定动作链”作为规划原语，在长视野多智能体协作任务中有效平衡了适应性与计算效率，在保持任务成功率的同时将 Token 消耗降低了 60-70%。

Shaobin Ling, Yun Wang, Chenyou Fan, Tin Lun Lam, Junjie Hu2026-03-10💻 cs

Cold-Start Active Correlation Clustering

该论文针对缺乏初始成对相似性信息的冷启动场景，提出了一种通过鼓励多样性来实现成本高效查询的覆盖感知主动关联聚类方法，并通过实验验证了其有效性。

Linus Aronsson, Han Wu, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

该论文首次系统性地提出并实证了“误演化”（Misevolution）概念，揭示了自进化大语言模型代理在模型、记忆、工具和工作流四个关键路径中可能偏离预期并引发安全对齐退化或漏洞等新型风险，从而强调了构建更安全自进化代理的紧迫性。

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

本文提出了一种名为 CroSTAta 的跨状态转换注意力 Transformer，通过引入新颖的状态转换注意力（STA）机制并结合训练时的时序掩码策略，使机器人策略能够显式建模演示中的时序结构（如失败与恢复模式），从而在模拟环境中显著提升了处理执行变化及精密任务的能力。

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Automated Extraction of Material Properties using LLM-based AI Agents

本文提出了一种基于大语言模型智能体的自动化工作流，成功从约 1 万篇科学文献中提取并构建了迄今为止规模最大的热电材料数据集，不仅显著降低了大规模数据提取的成本，还为数据驱动的材料发现奠定了坚实基础。

Subham Ghosh, Abhishek Tewari2026-03-10🔬 cond-mat.mtrl-sci

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

本文提出了 FOR-Prompting 协议，通过让“辩护者”提出答案、由“辩论者”仅提出质疑而不直接修正的不对称提示机制，在不依赖模型训练或内部访问的情况下，有效提升了各类大语言模型（尤其是小模型）在数学推理及开放任务中的自我修正能力与输出质量。

He Zhang, Anzhou Zhang, Jian Dai2026-03-10💬 cs.CL