Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks

该论文提出了一种结合堆叠分类器与自编码器的多层防御机制,并辅以对抗训练,旨在通过利用 GAN 和 FGSM 生成的对抗样本进行验证,从而提升基于机器学习的网络入侵检测系统(NIDS)在面对对抗攻击时的鲁棒性。

Nasim Soltani, Shayan Nejadshamsi, Zakaria Abou El Houda, Raphael Khoury, Kelton A. P. Costa, Tiago H. Falk, Anderson R. Avila2026-03-12🤖 cs.AI

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

该论文指出大语言模型低比特训练中的数值不稳定性主要由秩一均值偏差驱动,并提出通过简单的均值减法消除该偏差,从而在无需复杂 SVD 分解的情况下显著提升了 FP4 量化训练的稳定性与性能。

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

Modeling Stage-wise Evolution of User Interests for News Recommendation

该论文提出了一种统一框架,通过结合全局长期偏好建模与基于阶段划分的时间子图(融合 LSTM 与自注意力机制)来捕捉短期动态兴趣,从而有效解决了现有方法难以同时建模用户长期稳定偏好与随时间快速演变的短期兴趣的问题,显著提升了新闻推荐的时效性与相关性。

Zhiyong Cheng, Yike Jin, Zhijie Zhang, Huilin Chen, Zhangling Duan, Meng Wang2026-03-12🤖 cs.AI

Naïve Exposure of Generative AI Capabilities Undermines Deepfake Detection

该论文指出,生成式 AI 通过用户界面直接暴露的推理与图像优化能力(尤其是商业聊天机器人),使攻击者仅凭合规提示词即可生成既保留身份特征又具备高感知质量的图像,从而从根本上瓦解了现有深度伪造检测器的有效性,揭示了当前检测框架的威胁模型与真实世界生成式 AI 能力之间的结构性错位。

Sunpill Kim, Chanwoo Hwang, Minsu Kim, Jae Hong Seo2026-03-12🤖 cs.AI

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

该论文提出了一种将图注意力自编码器与大型语言模型(GPT-4o-mini)相结合的轻量级混合框架,通过利用结构推理对 LLM 生成数据进行去噪并优化蒙特卡洛树搜索,在资源受限条件下实现了在亚马逊棋游戏中超越基线及教师模型的高性能决策。

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

该论文提出了名为 IH-Challenge 的强化学习训练数据集,旨在解决大语言模型指令层级冲突的鲁棒性难题,通过微调显著提升了模型在对抗攻击下的安全性与指令遵循能力,并开源了该数据集以推动相关研究。

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI

UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery

本文提出了一种基于多智能体强化学习(MARL)的框架,利用近端策略优化(PPO)算法在部分可观测环境下协调无人机群,以应对医疗物资配送中需求紧急性、位置分布及时间截止期等动态不确定性挑战,并通过真实地理数据验证了其在实时任务优先级排序与资源动态分配方面的优越性能。

Islam Guven, Mehmet Parlak2026-03-12🤖 cs.LG

Prompting with the human-touch: evaluating model-sensitivity of foundation models for musculoskeletal CT segmentation

该研究通过在四个解剖区域对 11 种可提示基础模型进行非迭代 2D 和 3D 提示策略评估,揭示了模型性能差异显著、人类提示会导致性能下降且模型对人类输入变化高度敏感,表明在真实人机交互场景下选择最优模型仍具挑战性。

Caroline Magg, Maaike A. ter Wee, Johannes G. G. Dobbe, Geert J. Streekstra, Leendert Blankevoort, Clara I. Sánchez, Hoel Kervadec2026-03-12🤖 cs.AI

Towards Cognitive Defect Analysis in Active Infrared Thermography with Vision-Text Cues

该论文提出了一种基于视觉 - 语言模型(VLM)的零样本框架,通过引入专用的 AIRT-VLM 适配器将热成像数据与预训练多模态表征对齐,从而在不依赖大量标注数据集的情况下,实现了对碳纤维复合材料(CFRP)亚表面缺陷的生成式理解与高精度定位。

Mohammed Salah, Eman Ouda, Giuseppe Dell'Avvocato, Fabrizio Sarasini, Ester D'Accardi, Jorge Dias, Davor Svetinovic, Stefano Sfarra, Yusra Abdulrahman2026-03-12⚡ eess

CUAAudit: Meta-Evaluation of Vision-Language Models as Auditors of Autonomous Computer-Use Agents

该论文通过大规模元评估研究了视觉语言模型作为自主计算机使用代理审计器的能力,发现尽管这些模型在准确率和置信度校准方面表现强劲,但在复杂或异构环境中仍存在性能下降及模型间判断不一致的问题,从而揭示了当前基于模型的审计方法在评估真实世界自主代理时的根本局限性。

Marta Sumyk, Oleksandr Kosovan2026-03-12🤖 cs.AI

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

该论文通过实证研究反驳了道德推理任务必须依赖多样性算法的假设,发现基于奖励最大化的 RLVR 方法在道德对齐任务中同样有效,因为与数学推理不同,道德推理的高奖励响应在语义空间中呈现更集中的分布。

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI