cs.AI 篇论文 | Gist.Science

Emotion Transcription in Conversation: A Benchmark for Capturing Subtle and Complex Emotional States through Natural Language

该论文针对现有对话情感识别方法难以捕捉复杂微妙情感状态的局限，提出了“对话情感转录”（ETC）新任务，并构建了包含日语自然语言情感描述及分类标签的数据集，旨在推动更富表现力的对话情感理解研究。

Yoshiki Tanaka, Ryuichi Uehara, Koji Inoue, Michimasa Inaba2026-03-10💬 cs.CL

Fine-Grained Table Retrieval Through the Lens of Complex Queries

本文提出了一种名为 DCTR 的细粒度表格检索机制，通过细粒度类型查询分解和全局连通性感知，有效解决了开放域复杂查询场景下关系数据库问答中的检索挑战，并在行业基准测试中展现了其针对高复合查询和密集连接数据库的鲁棒性。

Wojciech Kosiuk, Xingyu Ji, Yeounoh Chung, Fatma Özcan, Madelon Hulsebos2026-03-10💬 cs.CL

Improving reasoning at inference time via uncertainty minimisation

该论文提出了一种在推理阶段通过最大化模型内部“自我确定性”来最小化不确定性的新方法，该方法在思维层面而非词元层面进行选择，以少量采样显著提升了大语言模型在数学推理任务中的表现，并揭示了早期推理步骤的确定性对最终准确性的关键预测作用。

Nicolas Legrand, Kenneth Enevoldsen, Márton Kardos, Kristoffer Nielbo2026-03-10💻 cs

Learning to Rank the Initial Branching Order of SAT Solvers

该论文提出了一种利用图神经网络预测 SAT 求解器初始分支顺序的预处理方法，在随机 3-CNF 和伪工业基准测试中显著提升了求解速度并展现出良好的泛化能力，但在更复杂的工业实例上因求解器动态启发式策略的覆盖及实例复杂性而效果有限。

Arvid Eriksson (KTH Royal Institute of Technology), Gabriel Poesia (Kempner Institute at Harvard University), Roman Bresson (Mohamed Bin Zayed University of Artificial Intelligence), Karl Henrik Johansson (KTH Royal Institute of Technology), David Broman (KTH Royal Institute of Technology)2026-03-10💻 cs

From State Changes to Creative Decisions: Documenting and Interpreting Traces Across Creative Domains

该论文针对现有方法在记录创意活动轨迹时缺乏意图与高层级创意决策关联的问题，提出了三种互补方案，分别通过节点式界面管理生成式 AI 状态、构建可视化创作词汇以及将语义历史嵌入交互状态，以更好地捕捉和解读跨领域的创意实践。

Xiaohan Peng, Sotiris Piliouras, Carl Abou Saada Nujaim2026-03-10💻 cs

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

本文针对自主智能体面临的提示注入等执行层漏洞，提出了包含沙箱隔离、意图验证、零信任授权及审计日志的四层治理架构（LGA），并通过构建双语基准测试与多模型实验，验证了该架构在保持低延迟的同时能有效拦截绝大多数恶意工具调用。

Yuxu Ge2026-03-10💻 cs

$\textbf{Re}^{2}$ : Unlocking LLM Reasoning via Reinforcement Learning with Re-solving

该论文提出了“重解强化学习”（Re²）方法，通过让大语言模型在推理过程中学会灵活放弃低效路径并重新解题，从而在无需监督微调的情况下显著提升其推理性能并解决过度思考问题。

Pinzheng Wang, Shuli Xu, Juntao Li, Yu Luo, Dong Li, Jianye Hao, Min Zhang2026-03-10💻 cs

A Miniature Brain Transformer: Thalamic Gating, Hippocampal Lateralization, Amygdaloid Salience, and Prefrontal Working Memory in Attention-Coupled Latent Memory

该论文提出了一种融合丘脑、杏仁核、前额叶及小脑等脑区模拟模块的微型脑 Transformer 架构，并通过实验揭示了一个反直觉的关键发现：仅有抑制性胼胝体耦合无法实现海马体功能侧化，必须依赖前额叶工作记忆缓冲器打破对称性，才能触发侧化状态的急剧相变。

Hong Jeong2026-03-10💻 cs

VINO: Video-driven Invariance for Non-contextual Objects via Structural Prior Guided De-contextualization

该论文提出了 VINO 框架，通过利用结构先验生成非语义视图并构建不对称蒸馏任务，有效解决了视频自监督学习中因前景与背景协同运动导致的上下文捷径问题，从而学习到具有强物体中心不变性的鲁棒特征表示。

Seul-Ki Yeom, Marcel Simon, Eunbin Lee, Tae-Ho Kim2026-03-10💻 cs

A Hybrid LTR-based System via Social Context Embedding for Recommending Solutions of Software Bugs in Developer Communities

该论文提出了一种基于学习排序（LTR）的混合推荐系统，通过利用深度学习技术挖掘 Stack Overflow 中的社交上下文嵌入，帮助开发者在软件社区中高效检索并推荐最相关的软件缺陷解决方案，其在推荐前 10 个答案时达到了约 78% 的准确率。

Fouzi Harrag, Mokdad Khemliche2026-03-10💻 cs

LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture

该论文针对卫星遥感预计算嵌入中几何不匹配及标准插值失效的问题，提出了一种学习几何等变性的预测架构（LEPA），通过直接预测几何变换后的嵌入而非简单插值，显著提升了 NASA/USGS HLS 影像及 ImageNet-1k 数据集上的几何调整精度（MRR 从低于 0.2 提升至 0.8 以上）。

Erik Scheurer, Rocco Sedona, Stefan Kesselheim, Gabriele Cavallaro2026-03-10💻 cs

Learning When to Cooperate Under Heterogeneous Goals

该论文针对具有异质目标的智能体协作场景，提出了一种结合模仿学习与强化学习的分层方法，使智能体能够自主判断何时合作或单独行动，从而在扩展的协作环境中显著优于基线方法。

Max Taylor-Davies, Neil Bramley, Christopher G. Lucas2026-03-10💻 cs

Kinematics-Aware Latent World Models for Data-Efficient Autonomous Driving

本文提出了一种将车辆运动学信息融入观察编码器并引入几何感知监督的 RSSM 潜在世界模型框架，通过增强潜在空间的结构化动力学表示，显著提升了自动驾驶策略学习的样本效率和长程想象保真度。

Jiazhuo Li, Linjiang Cao, Qi Liu, Xi Xiong2026-03-10💻 cs

VisualDeltas: Learning Preferences from Visual Quality Perturbations

VisualDeltas 提出了一种轻量级的偏好学习框架，通过利用多模态数据中的视觉质量扰动自动生成监督信号，从而在不依赖人工标注的情况下提升模型的视觉感知与推理能力。

Hailiang Huang, Yihao Liu, Shengyue Guan, Haoze Li, Sujian Li2026-03-10💻 cs

Do Deployment Constraints Make LLMs Hallucinate Citations? An Empirical Study across Four Models and Five Prompting Regimes

该研究通过实证分析发现，在部署约束下，四种主流大语言模型生成的学术引用存在率极低（最高仅 47.5%），且大量“未解决”的引用实为虚构，因此强烈建议在将其用于软件工程文献综述或工具链前必须进行事后引用验证。

Chen Zhao, Yuan Tang, Yitian Qian2026-03-10💻 cs

cs.AI

Emotion Transcription in Conversation: A Benchmark for Capturing Subtle and Complex Emotional States through Natural Language

Fine-Grained Table Retrieval Through the Lens of Complex Queries

Improving reasoning at inference time via uncertainty minimisation

Learning to Rank the Initial Branching Order of SAT Solvers

From State Changes to Creative Decisions: Documenting and Interpreting Traces Across Creative Domains

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

$\textbf{Re}^{2}$ : Unlocking LLM Reasoning via Reinforcement Learning with Re-solving

A Miniature Brain Transformer: Thalamic Gating, Hippocampal Lateralization, Amygdaloid Salience, and Prefrontal Working Memory in Attention-Coupled Latent Memory

VINO: Video-driven Invariance for Non-contextual Objects via Structural Prior Guided De-contextualization

A Hybrid LTR-based System via Social Context Embedding for Recommending Solutions of Software Bugs in Developer Communities

LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture

Learning When to Cooperate Under Heterogeneous Goals

Kinematics-Aware Latent World Models for Data-Efficient Autonomous Driving

VisualDeltas: Learning Preferences from Visual Quality Perturbations

Do Deployment Constraints Make LLMs Hallucinate Citations? An Empirical Study across Four Models and Five Prompting Regimes

MAviS: A Multimodal Conversational Assistant For Avian Species

A Cortically Inspired Architecture for Modular Perceptual AI

Spectral Discovery of Continuous Symmetries via Generalized Fourier Transforms

Data-Driven Hints in Intelligent Tutoring Systems

Adversarial Latent-State Training for Robust Policies in Partially Observable Domains

cs.AI

Emotion Transcription in Conversation: A Benchmark for Capturing Subtle and Complex Emotional States through Natural Language

Fine-Grained Table Retrieval Through the Lens of Complex Queries

Improving reasoning at inference time via uncertainty minimisation

Learning to Rank the Initial Branching Order of SAT Solvers

From State Changes to Creative Decisions: Documenting and Interpreting Traces Across Creative Domains

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

Re2\textbf{Re}^{2}Re2: Unlocking LLM Reasoning via Reinforcement Learning with Re-solving

A Miniature Brain Transformer: Thalamic Gating, Hippocampal Lateralization, Amygdaloid Salience, and Prefrontal Working Memory in Attention-Coupled Latent Memory

VINO: Video-driven Invariance for Non-contextual Objects via Structural Prior Guided De-contextualization

A Hybrid LTR-based System via Social Context Embedding for Recommending Solutions of Software Bugs in Developer Communities

LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture

Learning When to Cooperate Under Heterogeneous Goals

Kinematics-Aware Latent World Models for Data-Efficient Autonomous Driving

VisualDeltas: Learning Preferences from Visual Quality Perturbations

Do Deployment Constraints Make LLMs Hallucinate Citations? An Empirical Study across Four Models and Five Prompting Regimes

MAviS: A Multimodal Conversational Assistant For Avian Species

A Cortically Inspired Architecture for Modular Perceptual AI

Spectral Discovery of Continuous Symmetries via Generalized Fourier Transforms

Data-Driven Hints in Intelligent Tutoring Systems

Adversarial Latent-State Training for Robust Policies in Partially Observable Domains

$\textbf{Re}^{2}$ : Unlocking LLM Reasoning via Reinforcement Learning with Re-solving