cs.LG 篇论文 | Gist.Science

KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation

该论文针对基于图检索增强生成（GraphRAG）系统因依赖外部数据而面临的安全隐患，提出了一种名为 KEPo 的新型投毒攻击方法，通过构建伪造的知识演化路径将有毒事件注入知识图谱，从而有效误导大语言模型生成攻击者预设的有害回答，并在单目标和多目标攻击场景下均取得了优于现有方法的攻击成功率。

Qizhi Chen, Chao Qi, Yihong Huang, Muquan Li, Rongzheng Wang, Dongyang Zhang, Ke Qin, Shuang Liang2026-03-13🤖 cs.LG

Sharpness-Aware Minimization for Generalized Embedding Learning in Federated Recommendation

该论文针对联邦推荐系统中因数据异构和稀疏性导致的通用物品嵌入学习困难问题，提出了一种名为 FedRecGEL 的新框架，通过从物品中心视角重构问题并结合锐度感知最小化技术，实现了更稳定的训练过程和更优的推荐性能。

Fengyuan Yu, Xiaohua Feng, Yuyuan Li, Changwang Zhang, Jun Wang, Chaochao Chen2026-03-13🤖 cs.LG

LongFlow: Efficient KV Cache Compression for Reasoning M

针对推理模型长输出场景下 KV 缓存占用高及现有压缩方法效率低的问题，本文提出了 LongFlow，一种基于当前查询中间结果进行高效重要性评估、无需额外存储且通过自定义融合算子实现的 KV 缓存压缩方法，在保持模型精度基本不变的同时实现了高达 80% 的缓存压缩和 11.8 倍的吞吐量提升。

Yi Su, Zhenxu Tian, Dan Qiao, Yuechi Zhou, Juntao Li, Min Zhang2026-03-13🤖 cs.LG

Gen-Fab: A Variation-Aware Generative Model for Predicting Fabrication Variations in Nanophotonic Devices

本文提出了 Gen-Fab，一种基于条件生成对抗网络（cGAN）的模型，能够根据纳米光子器件的设计布局生成高分辨率的制造结果预测，有效模拟过刻蚀、欠刻蚀及圆角等工艺变异，并在准确性和不确定性建模方面优于现有的确定性 U-Net 及蒙特卡洛 Dropout 等基线方法。

Rambod Azimi, Yuri Grinberg, Dan-Xia Xu, Odile Liboiron-Ladouceur2026-03-13🤖 cs.AI

CFD-HAR: User-controllable Privacy through Conditional Feature Disentanglement

本文提出了一种基于条件特征解耦的 CFD-HAR 方法，旨在通过潜在空间分离活动与敏感属性来实现用户可控的隐私保护，并将其与基于自编码器的少样本 HAR 方案在架构、隐私保障及数据效率等方面进行了对比分析，指出单一范式难以满足下一代 IoT 需求，进而呼吁构建兼顾隐私、适应性与鲁棒性的统一框架。

Alex Gn, Fan Li, S Kuniyilh, Ada Axan2026-03-13🤖 cs.LG

Simultaneous estimation of multiple discrete unimodal distributions under stochastic order constraints

该论文针对真实平台搜索行为分析场景，提出了一种在随机序约束下估计多个离散单峰分布的混合整数凸二次优化方法，实验表明该方法在小样本情况下能显著降低分布估计误差，而在数据充足时表现与现有方法相当。

Yasuhiro Yoshida, Noriyoshi Sukegawa, Jiro Iwanaga2026-03-13📊 stat

One Supervisor, Many Modalities: Adaptive Tool Orchestration for Autonomous Queries

该论文提出了一种名为"One Supervisor, Many Modalities"的代理 AI 框架，通过中央协调器动态分解并路由文本、图像、音频等多模态任务至专用工具，在保持准确率的同时显著降低了响应时间、对话重做率和成本。

Mayank Saini Arit Kumar Bishwas2026-03-13💬 cs.CL

Multi-Task Anti-Causal Learning for Reconstructing Urban Events from Residents' Reports

该论文提出了多任务反因果学习（MTAC）框架，通过利用跨任务不变性来学习共享因果图并重构潜在原因，在利用居民报告重建城市事件（如停车违规、废弃房产和卫生状况）的任务中显著提升了准确性。

Liangkai Zhou, Susu Xu, Shuqi Zhong, Shan Lin2026-03-13🤖 cs.LG

CAETC: Causal Autoencoding and Treatment Conditioning for Counterfactual Estimation over Time

本文提出了一种名为 CAETC 的新方法，通过结合对抗表示学习与自编码架构，在时间序列数据中构建部分可逆且治疗不变的表征，从而有效解决时间依赖混淆偏差问题并显著提升反事实估计的准确性。

Nghia D. Nguyen, Pablo Robles-Granda, Lav R. Varshney2026-03-13🤖 cs.LG

Survival Meets Classification: A Novel Framework for Early Risk Prediction Models of Chronic Diseases

该论文提出了一种将生存分析与分类技术相结合的新框架，利用大规模电子病历数据成功构建了五种常见慢性病的早期风险预测模型，其性能优于或媲美主流模型，并经由临床专家验证了生成的解释性。

Shaheer Ahmad Khan, Muhammad Usamah Shahid, Muddassar Farooq2026-03-13🤖 cs.LG

Hybrid Energy-Aware Reward Shaping: A Unified Lightweight Physics-Guided Methodology for Policy Optimization

本文提出了一种名为 H-EARS 的混合能量感知奖励塑形方法，通过将基于势函数的奖励塑形与能量感知动作正则化相结合，在无需完整系统动力学模型的情况下实现了线性复杂度，从而显著提升了深度强化学习在连续控制任务中的收敛速度、稳定性及能效。

Qijun Liao (School of Mechanical Engineering, University of Science and Technology Beijing, China), Jue Yang (School of Mechanical Engineering, University of Science and Technology Beijing, China), Yiting Kang (School of Mechanical Engineering, University of Science and Technology Beijing, China), Xinxin Zhao (School of Mechanical Engineering, University of Science and Technology Beijing, China), Yong Zhang (Jiangsu XCMG Construction Machinery Research Institute Co., Ltd., China), Mingan Zhao (Jiangsu XCMG Construction Machinery Research Institute Co., Ltd., China)2026-03-13🤖 cs.LG

AutoScout: Structured Optimization for Automating ML System Configuration

AutoScout 提出了一种面向机器学习系统配置（涵盖训练、微调及推理）的通用优化框架，通过混合离散/连续优化与分层依赖建模，结合自适应特征优先级排序及多保真度模拟器集成，在显著降低配置搜索成本的同时实现了比专家调优快 2.7 至 3.0 倍的训练加速。

Jimmy Shong, Yuhan Ding, Yihan Jiang, Liheng Jing, Haonan Chen, Gaokai Zhang, Aditya Akella, Fan Lai2026-03-13🤖 cs.LG

Fractional Rotation, Full Potential? Investigating Performance and Convergence of Partial RoPE

该论文系统研究了部分旋转位置编码（Partial RoPE）对 Transformer 模型训练动态和收敛性的影响，发现仅需对约 10% 的隐藏维度应用 RoPE 即可在保持与全量 RoPE 相当性能的同时实现高达 10 倍的显存节省，并为平衡效率与训练稳定性提供了实用指导。

Mohammad Aflah Khan, Krishna P. Gummadi, Manish Gupta, Abhilasha Ravichander2026-03-13🤖 cs.LG

Shape-of-You: Fused Gromov-Wasserstein Optimal Transport for Semantic Correspondence in-the-Wild

本文提出了名为"Shape-of-You"的新框架，通过结合 3D 基础模型与锚点线性化的融合 Gromov-Wasserstein 最优传输方法，在无需显式几何标注的情况下解决了语义对应中的几何歧义问题，并在 SPair-71k 和 AP-10k 数据集上取得了最先进性能。

Jiin Im, Sisung Liu, Je Hyeong Hong2026-03-13🤖 cs.LG

Personalized Federated Learning via Gaussian Generative Modeling

本文提出了基于高斯生成建模的个性化联邦学习方法 pFedGM，通过解耦特征提取与分类器、利用加权重采样建模客户端异质性，并引入受卡尔曼增益启发的双尺度融合框架，在兼顾全局协作与局部个性化的同时实现了优越的泛化性能。

Peng Hu, Jianwei Ma2026-03-13🤖 cs.LG

Simple Recipe Works: Vision-Language-Action Models are Natural Continual Learners with Reinforcement Learning

该论文通过系统性研究揭示，对于大型预训练视觉 - 语言 - 动作（VLA）模型而言，结合低秩适应（LoRA）的简单序列微调策略在持续强化学习中表现卓越，不仅能有效避免灾难性遗忘并保留零样本泛化能力，其效果甚至优于复杂的持续学习方法。

Jiaheng Hu, Jay Shim, Chen Tang, Yoonchang Sung, Bo Liu, Peter Stone, Roberto Martin-Martin2026-03-13🤖 cs.LG

Context-dependent manifold learning: A neuromodulated constrained autoencoder approach

本文提出了一种名为神经调节约束自编码器（NcAE）的新方法，通过引入神经调节机制动态调整几何约束参数，成功实现了在多变环境条件下解耦全局上下文与局部流形表示的自适应降维学习。

Jérôme Adriaens (Neuroengineering Lab, Department of Electrical Engineering and Computer Science, University of Liège), Guillaume Drion (Neuroengineering Lab, Department of Electrical Engineering and Computer Science, University of Liège), Pierre Sacré (Neuroengineering Lab, Department of Electrical Engineering and Computer Science, University of Liège)2026-03-13🤖 cs.LG

cs.LG