cs.CL 篇论文 | Gist.Science

Bridging Kolmogorov Complexity and Deep Learning: Asymptotically Optimal Description Length Objectives for Transformers

本文提出了一种基于柯尔莫哥洛夫复杂度的渐近最优描述长度目标框架，证明了其在 Transformer 模型中的存在性，并通过变分高斯混合先验构建了可微分的实用目标，从而为训练具有更强压缩能力和泛化性能的神经网络提供了理论路径。

Peter Shaw, James Cohan, Jacob Eisenstein + 1 more2026-03-04💬 cs.CL

Benefits and Pitfalls of Reinforcement Learning for Language Model Planning: A Theoretical Perspective

本文通过图论抽象从理论层面揭示了强化学习在提升大语言模型规划能力方面的优势与局限，指出监督微调易引入虚假解而强化学习依赖探索实现泛化，同时对比发现策略梯度存在多样性崩溃缺陷，而 Q 学习凭借离线学习和收敛时的多样性保持更具优势，但需警惕奖励设计不当引发的 Q 值偏差，并在 Blocksworld 基准测试中验证了这些理论发现。

Siwei Wang, Yifei Shen, Haoran Sun + 5 more2026-03-04📊 stat

Death of the Novel(ty): Beyond n-Gram Novelty as a Metric for Textual Creativity

该论文通过大规模专家标注研究指出，单纯依赖 n-gram 新颖性作为文本创造力指标存在严重缺陷，因为它忽略了“恰当性”这一关键维度，且高 n-gram 新颖性往往与低实用性相关，因此建议采用结合人类专家判断或更先进的大模型评估方法来更准确地衡量文本创造力。

Arkadiy Saakyan, Najoung Kim, Smaranda Muresan + 1 more2026-03-04💬 cs.CL

ManagerBench: Evaluating the Safety-Pragmatism Trade-off in Autonomous LLMs

该论文提出了 ManagerBench 基准，用于评估自主大语言模型在运营目标与人类安全发生冲突时的决策能力，研究发现前沿模型虽能准确识别危害，却因优先级的错误排序而在“安全”与“务实”的权衡中表现不佳，往往选择有害行动或过度保守导致失效。

Adi Simhi, Jonathan Herzig, Martin Tutek + 3 more2026-03-04💬 cs.CL

AccurateRAG: A Framework for Building Accurate Retrieval-Augmented Question-Answering Applications

本文介绍了 AccurateRAG 框架，该框架通过提供涵盖数据处理、微调、评估及本地系统构建的全流程工具，显著提升了检索增强生成（RAG）问答应用的性能，并在基准测试中取得了超越现有强基线的最新最佳结果。

Linh The Nguyen, Chi Tran, Dung Ngoc Nguyen + 3 more2026-03-04💬 cs.CL

Cache-to-Cache: Direct Semantic Communication Between Large Language Models

本文提出了 Cache-to-Cache (C2C) 新范式，通过直接投影和融合大语言模型的 KV-Cache 实现模型间深层语义通信，从而在避免文本生成延迟的同时，显著提升了多模型系统的准确率与推理速度。

Tianyu Fu, Zihan Min, Hanling Zhang + 4 more2026-03-04💬 cs.CL

LaDiR: Latent Diffusion Enhances LLMs for Text Reasoning

本文提出了 LaDiR 框架，通过结合变分自编码器构建结构化潜在推理空间与潜在扩散模型实现块级双向注意力的迭代优化，从而克服了传统自回归解码的局限，显著提升了大语言模型在数学推理与规划任务中的准确性、多样性及可解释性。

Haoqiang Kang, Yizhe Zhang, Nikki Lijing Kuang + 4 more2026-03-04💬 cs.CL

Mitigating Over-Refusal in Aligned Large Language Models via Inference-Time Activation Energy

本文提出了一种名为能量景观引导（ELS）的无需微调的推理时干预框架，通过训练轻量级能量模型动态引导大语言模型的隐藏状态，在保持安全性的同时显著降低了过度拒绝率。

Eric Hanchen Jiang, Weixuan Ou, Run Liu + 8 more2026-03-04📊 stat

Are Language Models Borrowing-Blind? A Multilingual Evaluation of Loanword Identification across 10 Languages

该论文通过评估 10 种语言下的多种预训练模型，发现尽管有明确指令和上下文信息，语言模型仍难以区分借词与原生词汇，且表现出对借词的偏见，这一发现对开发少数语言 NLP 工具及支持语言保护具有重要意义。

Mérilin Sousa Silva, Sina Ahmadi2026-03-04💬 cs.CL

STARS: Synchronous Token Alignment for Robust Supervision in Large Language Models

该论文提出了 STARS 算法，通过引入基于固定时间间隔的同步验证机制，克服了现有推理时对齐方法依赖模型不确定性所带来的幻觉风险与硬件利用率低下问题，在显著提升大语言模型对齐可靠性与系统吞吐量的同时，实现了更具可扩展性的安全部署。

Mohammad Atif Quamar, Mohammad Areeb, Mikhail Kuznetsov + 2 more2026-03-04💬 cs.CL

Are We Asking the Right Questions? On Ambiguity in Natural Language Queries for Tabular Data Analysis

该论文提出将自然语言查询中的歧义重构为用户与系统共同承担责任的协作特征，通过建立区分可协作解析与不可解析查询的框架，揭示了现有评估中查询类型混杂的问题，并为表数据分析自然语言接口的设计与评估指明了未来方向。

Daniel Gomm, Cornelius Wolff, Madelon Hulsebos2026-03-04💬 cs.CL

TransactionGPT

本文介绍了 TransactionGPT，这是一种基于十亿级真实交易数据训练、采用专为捕捉支付动态而设计的 3D-Transformer 架构的消费交易基础模型，其在异常检测、交易生成及效率方面均显著优于现有基线模型和微调大语言模型。

Yingtong Dou, Zhimeng Jiang, Tianyi Zhang + 26 more2026-03-04💬 cs.CL

From Passive to Persuasive: Steering Emotional Nuance in Human-AI Negotiation

本文提出了一种基于激活工程的精确可解释框架，通过利用归因修补技术定位关键干预点并构建情感表达向量，成功引导 LLaMA 3.1-8B 模型在谈判对话中展现出更丰富的人类情感细微差别和更强的个人参与感。

Niranjan Chebrolu, Gerard Christopher Yeo, Kokil Jaidka2026-03-04💬 cs.CL

Automated Data Enrichment using Confidence-Aware Fine-Grained Debate among Open-Source LLMs for Mental Health and Online Safety

本文提出了一种基于开源大语言模型的“置信度感知细粒度辩论”（CFD）框架，通过模拟协作标注机制有效解决了心理健康与在线安全领域多标签数据标注困难的问题，并在引入新构建的专家标注数据集后，验证了该框架在提升下游任务性能方面的显著优势。

Junyu Mao, Anthony Hills, Talia Tseriotou + 10 more2026-03-04💬 cs.CL

cs.CL