cs.CL 篇论文 | Gist.Science

LatentMem: Customizing Latent Memory for Multi-Agent Systems

本文提出了名为 LatentMem 的可学习多智能体记忆框架，通过引入经验库、记忆合成器及 Latent Memory 策略优化（LMPO）技术，有效解决了现有系统中记忆同质化与信息过载问题，实现了无需修改底层框架即可显著提升多智能体系统性能的定制化记忆机制。

Muxin Fu, Xiangyuan Xue, Yafu Li, Zefeng He, Siyuan Huang, Xiaoye Qu, Yu Cheng, Yang Yang2026-03-10🤖 cs.LG

Measuring Complexity at the Requirements Stage: Spectral Metrics as Development Effort Predictors

该研究利用自然语言处理技术从需求文本中提取结构网络，并通过分子集成任务作为结构同构代理进行受控实验，证实了基于谱的度量指标（相关系数超过 0.95）能有效预测集成工作量，从而填补了架构复杂度分析与需求工程实践之间的关键方法学空白。

Maximilian Vierlboeck, Antonio Pugliese, Roshanak Nilchian, Paul Grogan, Rashika Sugganahalli Natesh Babu2026-03-10💬 cs.CL

Listen to the Layers: Mitigating Hallucinations with Inter-Layer Disagreement

该论文提出了一种名为 CoCoA 的免训练解码算法，通过利用大语言模型中间层表征的不一致性信号来识别并抑制幻觉，从而在不重新训练模型的情况下显著提升其在问答、摘要、推理及代码生成等任务中的事实准确性。

Koduvayur Subbalakshmi, Sabbir Hossain Ujjal, Venkata Krishna Teja Mangichetty, Nastaran Jamalipour Soofi2026-03-10💬 cs.CL

Neuro-Symbolic Synergy for Interactive World Modeling

该论文提出了 Neuro-Symbolic Synergy (NeSyS) 框架，通过交替训练将大语言模型的语义先验与可执行的符号规则相结合，利用符号模型直接约束输出分布并仅针对未覆盖轨迹微调神经模型，从而在 ScienceWorld、Webshop 和 Plancraft 等交互式环境中显著提升了世界模型的预测准确性、鲁棒性及数据效率。

Hongyu Zhao, Siyu Zhou, Haolin Yang, Zengyi Qin, Tianyi Zhou2026-03-10💬 cs.CL

Learning Page Order in Shuffled WOO Releases

该研究针对荷兰信息公开文件中页面顺序混乱的问题，通过对比多种排序模型发现，尽管特定方法在短文档上表现优异，但序列到序列模型在长文档上存在严重泛化失效，而通过模型专业化策略可显著提升长文档的排序性能。

Efe Kahraman, Giulio Tosato2026-03-10🤖 cs.LG

Discovering Semantic Latent Structures in Psychological Scales: A Response-Free Pathway to Efficient Simplification

该论文提出了一种无需依赖被试作答数据的语义主题建模框架，通过利用项目文本的语义结构自动发现潜在因子并精简量表，在显著缩短量表长度（平均减少 60.5%）的同时有效保持了原有的心理测量学属性。

Bo Wang, Yuxuan Zhang, Yueqin Hu, Hanchao Hou, Kaiping Peng, Shiguang Ni2026-03-10🤖 cs.LG

Towards interpretable models for language proficiency assessment: Predicting the CEFR level of Estonian learner texts

该研究通过筛选与语言复杂度及正确性相关的特定语言学特征，构建了可解释的机器学习模型，成功实现了对爱沙尼亚语学习者文本 CEFR 等级的高精度分类，并将该成果集成到了开源语言学习环境中。

Kais Allkivi2026-03-10💬 cs.CL

A Geometric Taxonomy of Hallucinations in LLMs

该论文提出了一种基于嵌入空间几何特征的大语言模型幻觉分类法，将幻觉划分为不忠实、虚构和事实错误三类，并据此开发了相应的检测指标，同时揭示了现有基准测试中因标注风格混淆而导致的事实错误检测理论局限。

Javier Marín2026-03-10💬 cs.CL

Why Code, Why Now: Learnability, Computability, and the Real Limits of Machine Learning

该论文提出基于信息结构的五级可学习性层级，通过区分表达性、可计算性与可学习性，论证了代码生成因具备稠密可验证反馈而比强化学习更易扩展，并指出机器学习进展的上限取决于任务本身的可学习性而非单纯依赖模型规模。

Zhimin Zhao2026-03-10🤖 cs.LG

Explainable Token-level Noise Filtering for LLM Fine-tuning Datasets

该论文提出了可解释的 Token 级噪声过滤框架 XTF，通过将数据贡献分解为推理重要性、知识新颖性和任务相关性三个属性来识别并掩蔽噪声 Token 的梯度，从而在多个下游任务中显著提升了大语言模型微调后的性能。

Yuchen Yang, Wenze Lin, Enhao Huang, Zhixuan Chu, Hongbin Zhou, Lan Tao, Yiming Li, Zhan Qin, Kui Ren2026-03-10💬 cs.CL

Understand Then Memory: A Cognitive Gist-Driven RAG Framework with Global Semantic Diffusion

CogitoRAG 是一种受人类情景记忆启发的检索增强生成框架，通过构建多维知识图谱、提取语义主旨、执行实体扩散检索及引入 CogniRank 重排序算法，有效解决了传统方法中的语义完整性丢失问题，在复杂知识整合与推理任务中显著优于现有方法。

Pengcheng Zhou, Haochen Li, Zhiqiang Nie, JiaLe Chen, Qing Gong, Weizhen Zhang, Chun Yu2026-03-10💬 cs.CL

Emotion Collider: Dual Hyperbolic Mirror Manifolds for Sentiment Recovery via Anti Emotion Reflection

本文提出了名为 Emotion Collider (EC-Net) 的双曲超图框架，该框架利用庞加莱球嵌入表示模态层次结构，并通过双向消息传递、双曲空间对比学习及自适应超边构建，在噪声或部分模态缺失的情况下显著提升了多模态情感识别的鲁棒性与准确率。

Rong Fu, Ziming Wang, Shuo Yin, Haiyun Wei, Kun Liu, Xianda Li, Zeli Su, Simon Fong2026-03-10🤖 cs.LG

ModalImmune: Immunity Driven Unlearning via Self Destructive Training

本文提出了 ModalImmune 框架，通过训练过程中可控地坍缩特定模态信息并结合自适应正则化、信息增益引导控制及曲率感知梯度掩蔽等技术，使多模态模型在面对输入通道丢失或损坏时仍能保持鲁棒性、收敛稳定性及重建能力。

Rong Fu, Jia Yee Tan, Zijian Zhang, Ziming Wang, Zhaolu Kang, Muge Qi, Shuning Zhang, Simon Fong2026-03-10🤖 cs.LG

Condition-Gated Reasoning for Context-Dependent Biomedical Question Answering

该论文提出了首个针对条件性生物医学问答的基准 CondMedQA 以及一种名为条件门控推理（CGR）的新框架，通过构建条件感知知识图谱并基于查询条件动态激活或剪枝推理路径，有效解决了现有系统忽视患者特异性因素（如并发症和禁忌症）导致推理不准确的问题。

Jash Rajesh Parekh, Wonbin Kweon, Joey Chan, Rezarta Islamaj, Robert Leaman, Pengcheng Jiang, Chih-Hsuan Wei, Zhizheng Wang, Zhiyong Lu, Jiawei Han2026-03-10💬 cs.CL

MrBERT: Modern Multilingual Encoders via Vocabulary, Domain, and Dimensional Adaptation

本文介绍了基于 ModernBERT 架构、支持 35 种语言及代码的 MrBERT 模型系列，该系列通过词汇、领域和维度适配（含 Matryoshka 表示学习）在加泰罗尼亚语、西班牙语及生物医学、法律等专业领域实现了最先进的性能，同时显著降低了推理与存储成本。

Daniel Tamayo, Iñaki Lacunza, Paula Rivera-Hidalgo, Severino Da Dalt, Javier Aula-Blasco, Aitor Gonzalez-Agirre, Marta Villegas2026-03-10🤖 cs.LG

CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion

本文提出了 CeRA（容量增强型秩适应）方法，通过引入 SiLU 门控和结构式丢弃在权重层面实现流形扩展，从而突破低秩适应（LoRA）在复杂推理任务中因线性约束导致的性能瓶颈，以显著更低的秩实现了超越高秩 LoRA 的谱效率与推理能力。

Hung-Hsuan Chen2026-03-10🤖 cs.LG

KVSlimmer: Theoretical Insights and Practical Optimizations for Asymmetric KV Merging

本文提出了 KVSlimmer，一种基于谱能量分布理论构建的无梯度高效算法，通过精确的 Hessian 信息推导闭式解，在显著降低大语言模型 KV 缓存内存与延迟的同时，实现了优于现有最先进方法的压缩性能与推理效果。

Lianjun Liu, Hongli An, Weiqi Yan, Xin Du, Shengchuan Zhang, Huazhong Liu, Yunshan Zhong2026-03-10💬 cs.CL

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

该论文提出了一种共形预测框架，通过针对不同临床文档结构（如结构化 FDA 标签与自由文本放射报告）中大语言模型置信度校准偏差的异质性进行自适应调整，在确保医疗实体提取达到 90% 以上覆盖率的同时实现了可控的拒绝率，从而为临床安全部署提供了保障。

Manil Shrestha, Edward Kim2026-03-10💬 cs.CL

CyclicJudge: Mitigating Judge Bias Efficiently in LLM-based Evaluation

该论文提出了一种名为 CyclicJudge 的轮询分配策略，通过方差分解分析证明其在固定调用预算下能以最经济的方式（与单法官评估成本相当）精准消除大模型评估中的系统性法官偏差，从而显著提升 MT-Bench 和 MindEval 等基准测试的排名可靠性。

Ziyi Zhu, Olivier Tieleman, Alexey Bukhtiyarov, Jinghong Chen2026-03-10💬 cs.CL

PrivMedChat: End-to-End Differentially Private RLHF for Medical Dialogue Systems

本文提出了 PrivMedChat，这是一个面向医疗对话系统的端到端差分隐私强化学习人类反馈（DP-RLHF）框架，该框架通过在监督微调、奖励模型学习及策略优化各阶段实施差分隐私保护，并采用无需标注的偏好构建策略，在确保严格隐私保障的同时实现了医疗聊天机器人的安全对齐与实用化。

Sudip Bhujel2026-03-10💬 cs.CL