cs.CL 篇论文 | Gist.Science

Aligning the True Semantics: Constrained Decoupling and Distribution Sampling for Cross-Modal Alignment

该论文提出了一种名为 CDDS 的新颖跨模态对齐算法，通过引入双路径 UNet 进行约束解耦以及分布采样方法，有效解决了语义与模态信息区分标准缺失及模态间隙导致的对齐偏差问题，从而在多个基准测试中显著超越了现有最先进方法。

Xiang Ma, Lexin Fang, Litian Xu, Caiming Zhang2026-03-09🤖 cs.LG

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

该论文提出了名为 CBR-to-SQL 的框架，通过借鉴基于案例的推理（CBR）思想，将问答对抽象为可复用的案例模板并采用两阶段检索机制，有效解决了医疗领域文本转 SQL 任务中传统检索增强生成（RAG）方法面临的术语噪声、可扩展性差及数据稀缺等挑战，在 MIMICSQL 数据集上实现了优于现有方法的逻辑形式准确率与鲁棒性。

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

本文提出了 NOTAI.AI，一个结合曲率信号与神经风格特征、利用 XGBoost 分类器进行判别并通过 SHAP 值生成自然语言解释的可解释机器生成文本检测框架。

Oleksandr Marchenko Breneur, Adelaide Danilov, Aria Nourbakhsh, Salima Lamsiyah2026-03-09💬 cs.CL

Safer Reasoning Traces: Measuring and Mitigating Chain-of-Thought Leakage in LLMs

该论文提出了一种模型无关的框架，量化并分析了思维链（CoT）提示在推理过程中导致 personally identifiable information (PII) 泄露的风险，发现泄露程度随模型家族和推理预算变化，并评估了多种轻量级推理时检测机制以平衡效用与安全。

Patrick Ahrend, Tobias Eder, Xiyang Yang, Zhiyi Pan, Georg Groh2026-03-09💬 cs.CL

RACAS: Controlling Diverse Robots With a Single Agentic System

该论文提出了 RACAS 系统，这是一种通过自然语言交互的协作智能体架构，仅需机器人描述、动作定义和任务指令即可在不修改代码或模型权重的情况下，实现对轮式地面机器人、多关节机械臂及水下车辆等多样化平台的统一闭环控制。

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

The Fragility Of Moral Judgment In Large Language Models

该研究通过大规模扰动实验发现，大型语言模型的道德判断极易受叙事视角、说服性提示及任务协议形式的影响，表明其道德评估结果更多取决于呈现方式而非道德实质，从而引发了关于可复现性与公平性的严重担忧。

Tom van Nuenen, Pratik S. Sachdeva2026-03-09🤖 cs.AI

FreeTxt-Vi: A Benchmarked Vietnamese-English Toolkit for Segmentation, Sentiment, and Summarisation

FreeTxt-Vi 是一款开源的基于 Web 的双语（越南语 - 英语）文本分析工具包，它通过集成混合分词策略、微调的情感分类器和摘要模型，在无需编程基础的情况下实现了分割、情感分析和摘要任务的基准评估，旨在降低多语言文本分析的技术门槛并推动越南语等低资源语言的研究发展。

Hung Nguyen Huy, Mo El-Haj, Dawn Knight, Paul Rayson2026-03-09💬 cs.CL

Autonomous Algorithm Discovery for Ptychography via Evolutionary LLM Reasoning

本文提出了一种名为 Ptychi-Evolve 的自主框架，该框架利用大语言模型结合进化机制（如语义引导的交叉与变异）自动发现并演化新的正则化算法，在多种挑战性成像数据集中显著提升了相干衍射成像的重建质量并实现了可解释的算法演化记录。

Xiangyu Yin, Ming Du, Junjing Deng, Zhi Yang, Yimo Han, Yi Jiang2026-03-09🤖 cs.AI

Towards Robust Retrieval-Augmented Generation Based on Knowledge Graph: A Comparative Analysis

本文利用 RGB 基准在四种场景下对比分析了传统 RAG 与基于知识图谱的 GraphRAG，并通过三种定制化改进方案验证了后者在提升检索增强生成系统鲁棒性方面的优势。

Hazem Amamou, Stéphane Gagnon, Alan Davoust, Anderson R. Avila2026-03-09💬 cs.CL

Cultural Perspectives and Expectations for Generative AI: A Global Survey Approach

该论文通过一项涵盖全球多地区的大规模调查，从不同社群中提炼出文化的操作性定义，以评估人们对生成式 AI 如何呈现文化 artifacts、概念及价值观的看法与期望，并最终提出了包括参与式方法、超越地理维度的文化考量以及文化“红线”敏感性框架在内的开发建议。

Erin van Liemt, Renee Shelby, Andrew Smart, Sinchana Kumbale, Richard Zhang, Neha Dixit, Qazi Mamunur Rashid, Jamila Smith-Loud2026-03-09🤖 cs.AI

Structured Multidimensional Representation Learning for Large Language Models

该论文提出了一种基于张量 L-乘积谱分解的 L-Transformer 架构，通过将嵌入空间映射到变换域并分解为多个独立谱子 Transformer，在保持语义等价性的同时显著减少了编码器参数量（最高达 75%），并通过引入频率归纳偏置提升了模型的泛化能力。

Alaa El Ichi, Khalide Jbilou, Mohamed El Guide, Franck Dufrenois2026-03-09💬 cs.CL

Let's Talk, Not Type: An Oral-First Multi-Agent Architecture for Guaraní

该论文以巴拉圭官方语言瓜拉尼语为例，批判了当前人工智能系统以文本为中心的局限性，并提出了一种尊重原住民数据主权和口语实践的口语优先多智能体架构，主张将对话中的轮流发言、修复机制及共享语境作为交互的核心设计要素。

Samantha Adorno, Akshata Kishore Moharir, Ratna Kandala2026-03-09💬 cs.CL

CodeScout: Contextual Problem Statement Enhancement for Software Agents

本文提出了 CodeScout，一种通过轻量级预探索将模糊的用户请求转化为包含复现步骤、预期行为及探索提示的综合性问题陈述的上下文查询优化方法，该方法在不修改现有智能体架构的前提下，显著提升了其在 SWEBench-Verified 基准上的代码问题解决率。

Manan Suri, Xiangci Li, Mehdi Shojaie, Songyang Han, Chao-Chun Hsu, Shweta Garg, Aniket Anand Deshmukh, Varun Kumar2026-03-09💬 cs.CL

NERdME: a Named Entity Recognition Dataset for Indexing Research Artifacts in Code Repositories

该论文介绍了 NERdME，这是一个包含 200 个手动标注 README 文件的数据集，旨在解决现有学术信息提取数据集忽视代码仓库实现细节的问题，并通过实验验证了其在支持研究 artifact 发现与元数据集成方面的价值。

Genet Asefa Gesese, Zongxiong Chen, Shufan Jiang, Mary Ann Tan, Zhaotai Liu, Sonja Schimmler, Harald Sack2026-03-09💬 cs.CL

PVminerLLM: Structured Extraction of Patient Voice from Patient-Generated Text using Large Language Models

该论文提出了 PVminer 基准及经过监督微调的大语言模型 PVminerLLM，旨在从患者生成的文本中高效提取结构化患者声音信息，实验表明该方法在多种任务上显著优于提示基线，且无需超大模型规模即可实现可扩展的社会与体验信号分析。

Samah Fodeh, Linhai Ma, Ganesh Puthiaraju, Srivani Talakokkul, Afshan Khan, Ashley Hagaman, Sarah Lowe, Aimee Roundtree2026-03-09🤖 cs.AI

Tutor Move Taxonomy: A Theory-Aligned Framework for Analyzing Instructional Moves in Tutoring

本文提出了一种名为“辅导者行为分类法”的理论驱动框架，该框架通过混合演绎与归纳方法构建，将辅导行为系统划分为四大类，旨在支持对一对一辅导对话进行大规模标注、AI 辅助分析及学习成效研究。

Zhuqian Zhou, Kirk Vanacore, Tamisha Thompson, Jennifer St John, Rene Kizilcec2026-03-09💬 cs.CL

Proof-of-Guardrail in AI Agents and What (Not) to Trust from It

该论文提出了“证明护栏”（Proof-of-Guardrail）系统，利用可信执行环境（TEE）为 AI 代理生成可验证的密码学证明，以确保证据表明响应确实经过了特定开源安全护栏的处理，同时指出即便有此类证明，恶意开发者仍可能通过主动越狱护栏来实施欺骗。

Xisen Jin, Michael Duan, Qin Lin, Aaron Chan, Zhenglun Chen, Junyi Du, Xiang Ren2026-03-09🤖 cs.AI

RouteGoT: Node-Adaptive Routing for Cost-Efficient Graph of Thoughts Reasoning

RouteGoT 提出了一种节点自适应路由框架，通过在 Graph of Thoughts 推理中根据子任务难度动态分配模型并集成全局预算控制，在显著降低 Token 消耗的同时提升了推理准确率与成本效益。

Yuhang Liu, Ruijie Wang, Yunlong Chu, Bing Hao, Yumeng Lin, Shengzhong Liu, Minglai Shao2026-03-09💬 cs.CL

HART: Data-Driven Hallucination Attribution and Evidence-Based Tracing for Large Language Models

本文提出了 HART 框架，通过构建首个细粒度幻觉追踪数据集并将幻觉溯源形式化为包含定位、归因、检索和因果追踪的四个阶段，实现了大语言模型幻觉类型、生成机制与外部事实证据之间的结构化对应与可解释性分析。

Shize Liang, Hongzhi Wang2026-03-09💬 cs.CL

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

该论文通过实证研究揭示了多示例提示（Many-Shot Prompting）在结构化任务中的有效性及其对示例选择策略的高度敏感性，同时指出了其在开放生成任务中的局限性，并对比分析了动态与强化 ICL 等替代策略，从而界定了输入空间测试时适应的实际边界与适用场景。

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG