cs.CL 篇论文 | Gist.Science

TableMind++: An Uncertainty-Aware Programmatic Agent for Tool-Augmented Table Reasoning

本文提出了 TableMind++，一种通过引入记忆引导的计划剪枝、基于置信度的动作优化及双重加权轨迹聚合等不确定性感知机制，有效缓解幻觉并显著提升工具增强型表格推理能力的程序化智能体。

Mingyue Cheng, Shuo Yu, Chuang Jiang, Xiaoyu Tao, Qingyang Mao, Jie Ouyang, Qi Liu, Enhong Chen2026-03-10💬 cs.CL

Accent Vector: Controllable Accent Manipulation for Multilingual TTS Without Accented Data

本文提出了名为“口音向量（Accent Vector）”的方法，通过微调多语言 TTS 系统并计算任务向量，实现了无需口音训练数据即可对多种语言进行细粒度和可组合的口音控制。

Thanathai Lertpetchpun, Thanapat Trachu, Jihwan Lee, Tiantian Feng, Dani Byrd, Shrikanth Narayanan2026-03-10💬 cs.CL

MAWARITH: A Dataset and Benchmark for Legal Inheritance Reasoning with LLMs

本文介绍了 MAWARITH，一个包含 12,500 个阿拉伯语伊斯兰继承案例的大规模数据集，旨在通过提供逐步推理链和提出 MIR-E 评估指标，解决大语言模型在处理复杂继承法推理时的挑战，并评估了多个模型在该任务上的表现。

Abdessalam Bouchekif, Shahd Gaben, Samer Rashwani, Somaya Eltanbouly, Mutaz Al-Khatib, Heba Sbahi, Mohammed Ghaly, Emad Mohamed2026-03-10💬 cs.CL

Learning-free L2-Accented Speech Generation using Phonological Rules

该论文提出了一种无需 accented 训练数据的 L2 口音语音生成框架，通过结合多语言 TTS 模型与音系规则，在音素级别实现了对西班牙语和印度口音英语的显式转换，在保持语音质量的同时有效实现了口音迁移。

Thanathai Lertpetchpun, Yoonjeong Lee, Jihwan Lee, Tiantian Feng, Dani Byrd, Shrikanth Narayanan2026-03-10💬 cs.CL

Nw\=ach\=a Mun\=a: A Devanagari Speech Corpus and Proximal Transfer Benchmark for Nepal Bhasha ASR

该论文发布了首个尼泊尔语（Newari）5.39 小时人工转写天城文语音语料库"Nw\=ach\=a Mun\=a"，并证明在超低资源自动语音识别任务中，利用地理和语言邻近的尼泊尔语进行迁移学习，能以更少的参数量达到与大规模多语言模型相当的性能。

Rishikesh Kumar Sharma, Safal Narshing Shrestha, Jenny Poudel, Rupak Tiwari, Arju Shrestha, Rupak Raj Ghimire, Bal Krishna Bal2026-03-10💬 cs.CL

KCoEvo: A Knowledge Graph Augmented Framework for Evolutionary Code Generation

本文提出了 KCoEvo 框架，通过构建静态与动态 API 知识图谱将代码迁移任务分解为演化路径检索与路径感知代码生成两个协同阶段，利用真实 API 差异自动生成的合成监督数据训练模型，显著提升了大语言模型在应对 API 变更时的迁移准确性、可控性及执行成功率。

Jiazhen Kang, Yuchen Lu, Chen Jiang, Jinrui Liu, Tianhao Zhang, Bo Jiang, Ningyuan Sun, Tongtong Wu, Guilin Qi2026-03-10💬 cs.CL

StyleBench: Evaluating Speech Language Models on Conversational Speaking Style Control

本文提出了 StyleBench，这是一个用于从情感、语速、音量和音高四个维度全面评估语音语言模型在对话中说话风格强度控制能力的多轮对话基准。

Haishu Zhao, Aokai Hao, Yuan Ge, Zhenqiang Hong, Tong Xiao, Jingbo Zhu2026-03-10💬 cs.CL

KohakuRAG: A simple RAG framework with hierarchical document indexing

本文介绍了 KohakuRAG，一种通过四层树状分层索引、LLM 驱动的查询规划与重排序以及集成推理投票机制，在 WattBot 2025 挑战赛中以 0.861 分夺得榜首并实现高精度引用与数值回答的开源检索增强生成框架。

Shih-Ying Yeh, Yueh-Feng Ku, Ko-Wei Huang, Buu-Khang Tu2026-03-10💬 cs.CL

Scalable Training of Mixture-of-Experts Models with Megatron Core

本文介绍了 Megatron Core 中针对混合专家（MoE）模型可扩展训练的系统级协同优化方案，通过整合内存、通信和计算层面的多项创新技术，在 NVIDIA GB300/GB200 集群上实现了 DeepSeek-V3 和 Qwen3 等超大规模模型的高效、生产就绪型训练。

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)2026-03-10🤖 cs.LG

Large Language Model for Discrete Optimization Problems: Evaluation and Step-by-step Reasoning

该论文通过构建涵盖多种问题类型和参数规模的自然语言离散优化数据集，评估了包括 Llama-3 系列和 ChatGPT 在内的不同大语言模型及思维链（CoT）方法的性能，发现强模型表现更优但 CoT 并非总是有效，且数据扰动虽能提升简单问题的表现却引入了不稳定性，从而为自动化求解离散优化问题提供了基准评估与实用建议。

Tianhao Qian, Guilin Qi, Z. Y. Wu, Ran Gu, Xuanyi Liu, Canchen Lyu2026-03-10💬 cs.CL

3ViewSense: Spatial and Mental Perspective Reasoning from Orthographic Views in Vision-Language Models

本文针对视觉语言模型在空间推理任务中的“空间智能差距”，提出了名为 3ViewSense 的框架，通过引入基于正交视图的“模拟与推理”机制，将自我中心感知与外部参考对齐，从而显著提升了模型在遮挡计数和视角一致性推理等复杂空间任务中的表现。

Shaoxiong Zhan, Yanlin Lai, Zheng Liu, Hai Lin, Shen Li, Xiaodong Cai, Zijian Lin, Wen Huang, Hai-Tao Zheng2026-03-10💬 cs.CL

Whitening Reveals Cluster Commitment as the Geometric Separator of Hallucination Types

该论文通过 PCA 白化处理揭示了“聚类一致性”是区分幻觉类型（特别是区分难以分辨的类型 1 和类型 2）的关键几何指标，证明了类型 1 与 2 的不可分性源于模型容量限制而非测量伪影，并指出了在微信号 regime 下提示集敏感性对实验结果的重要影响。

Matic Korun2026-03-10💬 cs.CL

QuadAI at SemEval-2026 Task 3: Ensemble Learning of Hybrid RoBERTa and LLMs for Dimensional Aspect-Based Sentiment Analysis

本文介绍了 QuadAI 团队在 SemEval-2026 任务 3 中提出的系统，该系统通过集成学习将结合回归与分类头的混合 RoBERTa 编码器与大语言模型（LLM）相结合，利用预测级堆叠显著提升了多维方面情感分析的性能。

A. J. W. de Vink, Filippos Karolos Ventirozos, Natalia Amat-Lefort, Lifeng Han2026-03-10💬 cs.CL

ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs

ArcLight 是一种专为多核 CPU 设计的轻量级大语言模型推理架构，通过集成高效的内存管理、线程调度及细粒度张量并行技术，有效解决了跨 NUMA 节点内存访问开销问题，从而显著提升了推理吞吐量。

Yuzhuang Xu, Xu Han, Yuxuan Li, Wanxiang Che2026-03-10💬 cs.CL

Breaking Training Bottlenecks: Effective and Stable Reinforcement Learning for Coding Models

该论文针对现代代码生成模型的训练瓶颈，提出了包含条件截断掩码等三项创新的 MicroCoder-GRPO 算法，并配套发布了更具挑战性的 MicroCoder-Dataset 和更高效的 MicroCoder-Evaluator，通过大量实验验证了其在 LiveCodeBench v6 上显著的性能提升及 34 项关键训练洞察。

Zongqian Li, Shaohan Huang, Zewen Chi, Yixuan Su, Lexin Zhou, Li Dong, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG

Scaling Data Difficulty: Improving Coding Models via Reinforcement Learning on Fresh and Challenging Problems

该论文提出了包含自动难度过滤的四阶段数据处理框架，构建了强调新颖性与挑战性的 MicroCoder 数据集，并通过强化学习验证了其在提升代码生成模型解决高难度问题能力方面的显著优势。

Zongqian Li, Tengchao Lv, Shaohan Huang, Yixuan Su, Qinzheng Sun, Qiufeng Yin, Ying Xin, Scarlett Li, Lei Cui, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

该研究通过双指标评估框架，在尼泊尔文化语境下分析了七种大语言模型的社会偏见，发现显式同意偏见与隐式生成偏见存在显著差异且后者受温度参数非线性影响，揭示了当前模型在欠代表文化背景中偏见评估的局限性及去偏策略的紧迫性。

Ashish Pandey, Tek Raj Chhetri2026-03-10💬 cs.CL

cs.CL