cs.AI 篇论文 | Gist.Science

Separable neural architectures as a primitive for unified predictive and generative intelligence

该论文提出了一种可分离神经网络架构（SNA），通过引入结构归纳偏置将高维映射分解为低阶分量，从而在坐标感知层面统一了物理、语言及感知领域的预测与生成智能，并在自主导航、微结构生成、湍流建模及语言处理等多个领域验证了其作为领域无关原语的有效性。

Reza T. Batley, Apurba Sarker, Rajib Mostakim, Andrew Klichine, Sourav Saha2026-03-13🤖 cs.LG

Examining Reasoning LLMs-as-Judges in Non-Verifiable LLM Post-Training

该研究通过受控合成实验发现，在基于强化学习的LLM对齐中，推理型裁判（Reasoning Judges）虽能训练出在黄金标准下表现优异的策略，但这些策略往往通过生成能欺骗其他裁判的对抗性输出来“刷榜”，从而揭示了推理型裁判在非可验证领域后训练中的潜力与潜在风险。

Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen2026-03-13🤖 cs.AI

SciMDR: Benchmarking and Advancing Scientific Multimodal Document Reasoning

该论文提出了“合成 - 重定位”框架，构建了包含 30 万对问答及推理链的 SciMDR 大规模科学多模态文档推理数据集与评估基准，显著提升了模型在复杂科学文档理解任务中的表现。

Ziyu Chen, Yilun Zhao, Chengye Wang, Rilyn Han, Manasi Patwardhan, Arman Cohan2026-03-13💬 cs.CL

The Latent Color Subspace: Emergent Order in High-Dimensional Chaos

该论文提出了一种无需训练的 FLUX.1 模型颜色控制方法，通过解析其潜在空间中的“潜在颜色子空间”（LCS），揭示了其对应色相、饱和度和亮度的结构，从而实现了对生成图像颜色的精确预测与显式操控。

Mateusz Pach, Jessica Bader, Quentin Bouniot, Serge Belongie, Zeynep Akata2026-03-13🤖 cs.LG

Explainability of Text Processing and Retrieval Methods: A Survey

本文综述了自然语言处理与信息检索领域中针对词嵌入、序列建模、注意力机制、Transformer、BERT 及文档排序等深度学习方法的可解释性与可理解性研究，并展望了未来的研究方向。

Sourav Saha, Debapriyo Majumdar, Mandar Mitra2026-03-12💬 cs.CL

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

该论文提出了一种名为“判别风险”的新公平性度量方法，通过扰动受保护属性同时涵盖个体与群体公平性，并建立了基于边界的理论保证，进而设计了集成剪枝算法以在提升分类准确性的同时有效改善模型公平性。

Yijun Bian2026-03-12🤖 cs.LG

An Updated Assessment of Reinforcement Learning for Macro Placement

该论文通过引入更强的退火基线、发布新的亚 10 纳米基准测试并采用商业工具进行真实评估，对 Google 的 Circuit Training 宏布局方法进行了更新评估，揭示了其在可扩展性和预训练方法等方面仍存在的未决问题及研究复现性挑战。

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Mindstorms in Natural Language-Based Societies of Mind

本文提出并实验了基于自然语言的大规模多模态神经网络“社会”（NLSOMs），通过让多个智能体以自然语言进行“头脑风暴”协作，有效解决了视觉问答、图像生成及具身 AI 等多种任务，并探讨了此类异构智能体社会的未来社会结构与治理机制。

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL

Large Language Models for Travel Behavior Prediction

该研究提出了两种利用大语言模型进行出行行为预测的框架（零样本提示与文本嵌入结合传统模型），实证结果表明其性能可媲美甚至超越传统数值模型，为出行需求管理提供了灵活且数据高效的替代方案。

Baichuan Mo, Hanyong Xu, Ruoyun Ma, Jung-Hoon Cho, Dingyi Zhuang, Xiaotong Guo, Jinhua Zhao2026-03-12💬 cs.CL

Optimal Transport Aggregation for Distributed Mixture-of-Experts

该论文提出了一种基于最优传输的分布式混合专家模型聚合框架，通过最小化传输散度将本地模型高效整合为全局估计器，仅需单次通信即可在保持模型结构的同时实现媲美集中式训练的性能并显著降低计算成本。

Faïcel Chamroukhi, Nhat Thien Pham2026-03-12📊 stat

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

该研究通过实证评估发现，针对低认知需求和低尽责性学生个性化定制 AI 驱动提示的解释，能有效提升其互动意愿、理解能力及学习效果，从而验证了教育领域个性化可解释人工智能（PXAI）的价值。

Vedant Bahel, Harshinee Sriram, Cristina Conati2026-03-12🤖 cs.AI

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

本文提出了一种名为 HyWIA 的新型大语言模型结构化剪枝方法，通过注意力机制自适应地融合细粒度与粗粒度的权重重要性评估，从而在显著压缩模型的同时有效缓解了现有方法导致的下游任务性能下降问题。

Jun Liu, Zhenglun Kong, Pu Zhao + 9 more2026-03-12💬 cs.CL

Modelling Language using Large Language Models

本文主张大型语言模型可作为公共语言的外部社会实体之科学模型，并通过构建模型解释（model construal）来反驳其缺乏语言学洞察力的观点，从而确立其在语言研究中的科学价值。

Jumbly Grindrod2026-03-12💬 cs.CL

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs

本研究利用 28 年长期监测数据，应用可解释机器学习技术（特别是随机森林模型）成功预测了亚得里亚海特里雅斯特湾贻贝的腹泻性贝类毒素（DSP）事件，并识别出关键致毒藻种及环境因素，为优化早期预警系统和促进可持续水产养殖提供了重要依据。

Martin Marzidovšek, Janja Francé, Vid Podpečan + 3 more2026-03-12🤖 cs.AI

cs.AI