cs.LG 篇论文 | Gist.Science

GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification

该论文介绍了 GATech 团队在 AbjadGenEval 共享任务中利用多语言 E5-large 编码器检测阿拉伯语机器生成文本的方法，发现尽管尝试了多种复杂的池化策略，但简单的均值池化效果最佳（F1 达 0.75），且观察到人类文本通常比机器生成文本更长这一显著特征。

Ahmed Khaled Khamis2026-03-12💬 cs.CL

GATech at AbjadMed: Bidirectional Encoders vs. Causal Decoders: Insights from 82-Class Arabic Medical Classification

该论文通过对比实验表明，在阿拉伯语医疗文本的 82 类细粒度分类任务中，经过混合池化和正则化策略微调的双向编码器（如 AraBERTv2）在捕捉精确语义边界方面显著优于基于因果解码的大语言模型。

Ahmed Khaled Khamis2026-03-12💬 cs.CL

Personalized Group Relative Policy Optimization for Heterogenous Preference Alignment

该论文提出了个性化组相对策略优化（P-GRPO）框架，通过将优势估计与当前批次统计解耦并基于特定偏好群体的奖励历史进行归一化，有效解决了标准 GRPO 在异质偏好对齐中因假设样本可交换而导致的偏差问题，从而实现了对多样化用户偏好的更快速收敛和更精准对齐。

Jialu Wang, Heinrich Peters, Asad A. Butt, Navid Hashemi, Alireza Hashemi, Pouya M. Ghari, Joseph Hoover, James Rae, Morteza Dehghani2026-03-12🤖 cs.LG

Defining AI Models and AI Systems: A Framework to Resolve the Boundary Problem

该论文通过系统梳理现有文献与法规，揭示了"AI 模型”与"AI 系统”定义模糊导致的监管义务分配难题，并提出了基于参数架构与组件集成的清晰概念及操作性定义，旨在解决 AI 价值链中责任界定的边界问题。

Yuanyuan Sun, Timothy Parker, Lara Gierschmann, Sana Shams, Teo Canmetin, Mathieu Duteil, Rokas Gipiškis, Ze Shen Chin2026-03-12🤖 cs.AI

LWM-Temporal: Sparse Spatio-Temporal Attention for Wireless Channel Representation Learning

本文提出了 LWM-Temporal，这是一种面向无线信道时空特性的任务无关基础模型，它通过引入符合物理传播规律的稀疏时空注意力机制（SSTA）和基于物理信息的自监督预训练策略，显著降低了计算复杂度并学习到了可迁移的通用信道表征，从而在多种移动性场景下的信道预测任务中实现了优于基线的性能。

Sadjad Alikhani, Akshay Malhotra, Shahab Hamidi-Rad, Ahmed Alkhateeb2026-03-12🤖 cs.LG

HTM-EAR: Importance-Preserving Tiered Memory with Hybrid Routing under Saturation

本文提出了 HTM-EAR，一种结合 HNSW 工作记忆与归档存储的分层记忆系统，通过重要性感知淘汰机制和混合路由策略，在长周期运行且上下文受限的饱和场景下，有效平衡了关键信息保留与陈旧记忆遗忘，显著优于传统 LRU 等基线方法。

Shubham Kumar Singh2026-03-12🤖 cs.AI

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

Tureis 是一种面向智能家居边缘部署的自监督 Transformer 统一方法，它通过掩码重建机制和迭代隔离策略，在无需标签的情况下实现了对多故障、多住户场景下异构传感器故障的毫秒级检测与细粒度定位。

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

该论文在 NetSecGame 环境中评估了自主网络攻击代理在目标 IP 地址重分配场景下的泛化能力，发现尽管提示驱动的预训练大语言模型在未见地址空间下取得了最高成功率，但传统元学习代理仅表现出部分迁移能力，且所有方法均面临推理成本、可解释性或执行稳定性等方面的显著权衡。

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

该研究通过大规模对照实验发现，评估格式（如多项选择与开放式回答）对语言模型安全分数的影响远大于脚手架架构本身，且模型与脚手架之间存在显著的交互效应，导致无法建立通用的安全排名，因此必须针对特定模型和配置进行独立测试。

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

本文提出了一种基于通道门控调制的参数高效持续学习框架，通过冻结预训练骨干网络并仅学习对角缩放因子，在无需数据回放的情况下有效平衡了人类活动识别中的稳定性与可塑性，显著降低了灾难性遗忘并提升了模型在连续新主体任务上的最终准确率。

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

本文揭示了 Sharpness-Aware Minimization (SAM) 利用单步上升点梯度更新当前参数能更准确地逼近邻域内最大值的直观原理，并针对现有近似误差及多步上升带来的质量退化问题，提出了计算开销极低且性能更优的显式锐度感知最小化方法（XSAM）。

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

本文介绍了名为 InFusionLayer 的开源 Python 工具，该工具基于组合融合分析（CFA）中的秩分特征函数和认知多样性，构建了一种通用的机器学习架构，旨在通过融合多个基模型来优化监督与无监督的多分类问题，并已在多种计算机视觉数据集上验证了其易用性与有效性。

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

该论文指出将加密流量扁平化为字节序列会导致协议语义丢失，进而提出一种基于协议原生语义的表格化预训练范式 FlowSem-MAE，通过引入可预测性过滤、特定字段嵌入及双轴注意力机制，在仅使用一半标注数据的情况下显著优于现有最先进方法。

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

该论文提出了 OmniGuide 框架，通过将 3D 基础模型、语义推理大模型及人体姿态模型等多种引导源转化为可微的能量函数，显著提升了通用视觉 - 语言 - 动作（VLA）策略在复杂操作任务中的成功率与安全性。

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

Cluster-Aware Attention-Based Deep Reinforcement Learning for Pickup and Delivery Problems

本文提出了 CAADRL 框架，通过显式利用取送货问题（PDP）的多尺度聚类结构，结合集群感知编码与动态双解码器机制，在保持推理高效性的同时显著提升了求解性能。

Wentao Wang, Lifeng Han, Guangyu Zou2026-03-12🤖 cs.LG

Quantization of Ricci Curvature in Information Geometry

该论文解决了作者关于二元贝叶斯网络中基于费雪信息度量的体积平均里奇标量是否普遍量子化为半整数的二十年猜想，通过通用 Beta 函数抵消机制证明了树结构和完全图情形下的成立，同时通过显式环路反例证伪了普遍性，并进一步揭示了离散比特网络与高斯网络之间曲率符号的二元对立。

Carlos C. Rodriguez2026-03-12🔢 math

Training Language Models via Neural Cellular Automata

该论文提出利用神经细胞自动机生成可控且廉价的合成非语言数据对大语言模型进行“预预训练”，结果发现仅使用 1.64 亿个合成 token 即可在语言建模和推理任务上取得优于 16 亿自然语言 token 预训练的效果，并揭示了注意力层的高可迁移性及不同领域对合成数据复杂度的差异化需求。

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

本文提出 HTMuon 算法，通过引入重尾谱校正机制解决 Muon 优化器过度抑制重尾权重谱的问题，在 LLM 预训练和图像分类任务中显著提升了性能并提供了相应的理论收敛保证。

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

Improving Search Agent with One Line of Code

该论文针对工具增强代理强化学习（TARL）中因重要性采样分布漂移导致的训练崩溃问题，提出了一种仅需一行代码修改即可实施的 SAPO 算法，通过条件性 KL 约束稳定训练，在多个基准测试中显著提升了搜索智能体的性能。

Jian Li, Dongsheng Chen, Zhenhua Xu, Yizhang Jin, Jiafu Wu, Chengjie Wang, Xiaotong Yuan, Yabiao Wang2026-03-12🤖 cs.LG

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

该研究首次将稀疏自编码器应用于时间序列基础模型 Chronos-T5，通过因果特征消融实验揭示了其内部存在从低频特征到关键突变检测的层级结构，并发现模型预测性能的核心驱动力并非最终层的语义丰富表征，而是中间层中负责检测突变动态的因果特征。

Anurag Mishra2026-03-12🤖 cs.LG