cs.LG 篇论文 | Gist.Science

Interpreting Contrastive Embeddings in Specific Domains with Fuzzy Rules

本文提出了一种结合模糊规则分类系统与文本处理技术的方法，旨在将特定领域（如临床报告和影评）的自由文本映射到 CLIP 模型的向量空间，以解决通用嵌入模型在专业领域应用中的局限性并提升可解释性。

Javier Fumanal-Idocin, Mohammadreza Jamalifard, Javier Andreu-Perez2026-03-13🤖 cs.LG

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

该论文提出并验证了在大型预训练模型中，任务专家密集分布在参数空间邻域内，因此一种简单的随机采样扰动结合多数投票的并行后训练方法，其性能可与 PPO 等标准优化方法相媲美。

Yulu Gan, Phillip Isola2026-03-13🤖 cs.LG

Security Considerations for Artificial Intelligence Agents

本文基于 Perplexity 在运营通用智能体系统的实践经验，深入分析了 AI 智能体因架构变革带来的新型安全威胁与攻击面，并提出了涵盖多层防御机制、策略执行及未来研究方向的系统性安全建议。

Ninghui Li, Kaiyuan Zhang, Kyle Polley, Jerry Ma2026-03-13🤖 cs.LG

Temporal Straightening for Latent Planning

该论文受人类视觉处理中的感知拉直假说启发，提出了一种通过曲率正则化来优化潜在轨迹的“时间拉直”方法，从而改善了世界模型中潜在规划的表示学习，显著提升了基于梯度的规划稳定性及任务成功率。

Ying Wang, Oumayma Bounou, Gaoyue Zhou, Randall Balestriero, Tim G. J. Rudner, Yann LeCun, Mengye Ren2026-03-13🤖 cs.LG

STAMP: Selective Task-Aware Mechanism for Text Privacy

STAMP 是一种新的任务感知文本隐私框架，它通过结合任务重要性与隐私敏感度来动态分配隐私预算，并利用仅扰动嵌入方向而保留幅度的“极化机制”在 SQuAD、Yelp 和 AG News 等数据集上实现了更优的隐私与效用权衡。

Fengwei Tian, Payel Bhattacharjee, Heidi Hanson, Geoffrey D. Rubin, Joseph Y. Lo, Ravi Tandon2026-03-13🤖 cs.LG

BiGain: Unified Token Compression for Joint Generation and Classification

BiGain 是一个无需训练且即插即用的框架，它通过频率感知机制（包括拉普拉斯门控令牌合并与插值 - 外推键值下采样）在加速扩散模型的同时，有效平衡了生成质量与分类性能。

Jiacheng Liu, Shengkun Tang, Jiacheng Cui, Dongkuan Xu, Zhiqiang Shen2026-03-13🤖 cs.LG

Separable neural architectures as a primitive for unified predictive and generative intelligence

该论文提出了一种可分离神经网络架构（SNA），通过引入结构归纳偏置将高维映射分解为低阶分量，从而在坐标感知层面统一了物理、语言及感知领域的预测与生成智能，并在自主导航、微结构生成、湍流建模及语言处理等多个领域验证了其作为领域无关原语的有效性。

Reza T. Batley, Apurba Sarker, Rajib Mostakim, Andrew Klichine, Sourav Saha2026-03-13🤖 cs.LG

Examining Reasoning LLMs-as-Judges in Non-Verifiable LLM Post-Training

该研究通过受控合成实验发现，在基于强化学习的LLM对齐中，推理型裁判（Reasoning Judges）虽能训练出在黄金标准下表现优异的策略，但这些策略往往通过生成能欺骗其他裁判的对抗性输出来“刷榜”，从而揭示了推理型裁判在非可验证领域后训练中的潜力与潜在风险。

Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen2026-03-13🤖 cs.AI

Matching Features, Not Tokens: Energy-Based Fine-Tuning of Language Models

该论文提出了一种名为能量基微调（EBFT）的新方法，通过匹配序列级统计特征而非仅优化单 token 预测，在无需特定任务验证器的情况下，实现了比传统监督微调（SFT）更高的下游准确率和比强化学习（RLVR）更低的验证交叉熵。

Samy Jelassi, Mujin Kwun, Rosie Zhao, Yuanzhi Li, Nicolo Fusi, Yilun Du, Sham M. Kakade, Carles Domingo-Enrich2026-03-13🤖 cs.LG

Spatial-TTT: Streaming Visual-based Spatial Intelligence with Test-Time Training

本文提出了 Spatial-TTT，一种结合测试时训练（TTT）的流式视觉空间智能框架，通过设计混合架构、引入空间预测机制以及构建密集 3D 描述数据集，实现了在长视频流中对空间证据的高效选择、组织与更新，从而在视频空间基准测试中取得了最先进的性能。

Fangfu Liu, Diankun Wu, Jiawei Chi, Yimo Cai, Yi-Hsin Hung, Xumin Yu, Hao Li, Han Hu, Yongming Rao, Yueqi Duan2026-03-13🤖 cs.LG

The Latent Color Subspace: Emergent Order in High-Dimensional Chaos

该论文提出了一种无需训练的 FLUX.1 模型颜色控制方法，通过解析其潜在空间中的“潜在颜色子空间”（LCS），揭示了其对应色相、饱和度和亮度的结构，从而实现了对生成图像颜色的精确预测与显式操控。

Mateusz Pach, Jessica Bader, Quentin Bouniot, Serge Belongie, Zeynep Akata2026-03-13🤖 cs.LG

BEFANA: A Tool for Biodiversity-Ecosystem Functioning Assessment by Network Analysis

BEFANA 是一款基于 Python 的免费开源软件工具，通过交互式计算笔记本整合了生态网络分析、可视化及机器学习算法，旨在帮助生态学家高效研究生态网络的拓扑结构与动态特征。

Martin Marzidovšek, Vid Podpečan, Erminia Conti + 2 more2026-03-12🤖 cs.LG

Efficient Bayesian Updates for Deep Active Learning via Laplace Approximations

该论文提出了一种基于最后一层拉普拉斯近似的高斯后验的高效贝叶斯更新方法，通过闭式计算逆海森矩阵替代昂贵的重训练过程，从而显著降低了深度主动学习的计算成本，并支持基于序列构建和前瞻策略的多样化批次选择。

Denis Huseljic, Marek Herde, Lukas Rauch, Paul Hahn, Zhixin Huang, Daniel Kottke, Stephan Vogt, Bernhard Sick2026-03-12🤖 cs.LG

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

该论文提出了一种名为“判别风险”的新公平性度量方法，通过扰动受保护属性同时涵盖个体与群体公平性，并建立了基于边界的理论保证，进而设计了集成剪枝算法以在提升分类准确性的同时有效改善模型公平性。

Yijun Bian2026-03-12🤖 cs.LG

An Updated Assessment of Reinforcement Learning for Macro Placement

该论文通过引入更强的退火基线、发布新的亚 10 纳米基准测试并采用商业工具进行真实评估，对 Google 的 Circuit Training 宏布局方法进行了更新评估，揭示了其在可扩展性和预训练方法等方面仍存在的未决问题及研究复现性挑战。

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

该论文提出了一种基于凸松弛和分支定界的新框架，将低秩矩阵补全问题转化为可证明最优解的凸优化问题，从而在显著缩小最优性间隙的同时，大幅降低了测试集误差。

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean Pauphilet2026-03-12📊 stat

Mindstorms in Natural Language-Based Societies of Mind

本文提出并实验了基于自然语言的大规模多模态神经网络“社会”（NLSOMs），通过让多个智能体以自然语言进行“头脑风暴”协作，有效解决了视觉问答、图像生成及具身 AI 等多种任务，并探讨了此类异构智能体社会的未来社会结构与治理机制。

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL

cs.LG