cs.AI 篇论文 | Gist.Science

Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks

该论文提出了一种结合堆叠分类器与自编码器的多层防御机制，并辅以对抗训练，旨在通过利用 GAN 和 FGSM 生成的对抗样本进行验证，从而提升基于机器学习的网络入侵检测系统（NIDS）在面对对抗攻击时的鲁棒性。

Nasim Soltani, Shayan Nejadshamsi, Zakaria Abou El Houda, Raphael Khoury, Kelton A. P. Costa, Tiago H. Falk, Anderson R. Avila2026-03-12🤖 cs.AI

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

该论文提出了一种结合退化阶段同步采样（DSSBS）与跨域对齐融合大自编码器（CAFLAE）的领域自适应框架，通过解决退化阶段失配和长程时序依赖捕捉难题，显著提升了变工况下健康指标的学习性能。

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

该论文指出大语言模型低比特训练中的数值不稳定性主要由秩一均值偏差驱动，并提出通过简单的均值减法消除该偏差，从而在无需复杂 SVD 分解的情况下显著提升了 FP4 量化训练的稳定性与性能。

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

FAR-Dex: Few-shot Data Augmentation and Adaptive Residual Policy Refinement for Dexterous Manipulation

本文提出了 FAR-Dex 框架，通过结合基于 IsaacLab 的少样本数据增强与自适应残差策略优化，有效解决了多指灵巧手与机械臂协作中演示数据稀缺及高维动作空间复杂的难题，显著提升了仿真与真实环境下的操作成功率与泛化能力。

Yushan Bai, Fulin Chen, Hongzheng Sun, Yuchuang Tong, En Li, Zhengtao Zhang2026-03-12🤖 cs.AI

UniPINN: A Unified PINN Framework for Multi-task Learning of Diverse Navier-Stokes Equations

本文提出了 UniPINN 框架，通过共享 - 专用架构、跨流注意力机制及动态权重分配策略，有效解决了现有物理信息神经网络在求解多任务纳维 - 斯托克斯方程时面临的特征解耦困难、负迁移及训练不稳定等挑战，实现了跨不同流态的高精度统一学习。

Dengdi Sun, Jie Chen, Xiao Wang, Jin Tang2026-03-12🤖 cs.AI

G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

本文提出了 G-STAR，一种将时间感知说话人追踪模块与语音大语言模型转录骨干相结合的端到端系统，旨在解决长篇幅、多说话人重叠语音场景下，在保持会议级说话人身份一致性的同时生成带时间戳和说话人标签的转录文本的问题。

Jing Peng, Ziyi Chen, Haoyu Li, Yucheng Wang, Duo Ma, Mengtian Li, Yunfan Du, Dezhu Xu, Kai Yu, Shuai Wang2026-03-12⚡ eess

Modeling Stage-wise Evolution of User Interests for News Recommendation

该论文提出了一种统一框架，通过结合全局长期偏好建模与基于阶段划分的时间子图（融合 LSTM 与自注意力机制）来捕捉短期动态兴趣，从而有效解决了现有方法难以同时建模用户长期稳定偏好与随时间快速演变的短期兴趣的问题，显著提升了新闻推荐的时效性与相关性。

Zhiyong Cheng, Yike Jin, Zhijie Zhang, Huilin Chen, Zhangling Duan, Meng Wang2026-03-12🤖 cs.AI

Aligning Large Language Models with Searcher Preferences

本文提出了首个面向开放式生成式搜索的大语言模型 SearchLLM，通过设计分层多维奖励系统与门控聚合策略，在 RedNote 平台上实现了生成质量与用户参与度的显著提升，同时严格保障了安全性与事实准确性。

Wei Wu, Peilun Zhou, Liyi Chen, Qimeng Wang, Chengqiang Lu, Yan Gao, Yi Wu, Yao Hu, Hui Xiong2026-03-12💬 cs.CL

Learning to Negotiate: Multi-Agent Deliberation for Collective Value Alignment in LLMs

该论文提出了一种基于多智能体协商的框架，通过让同一 LLM 扮演对立角色进行结构化对话并利用 RLAIF 优化策略，在保持集体能动性（CA）对齐水平的同时，显著提升了模型在价值冲突场景下的协商与冲突解决能力。

Panatchakorn Anantaprayoon, Nataliia Babina, Nima Asgharbeygi, Jad Tarifi2026-03-12💬 cs.CL

JEDI: Jointly Embedded Inference of Neural Dynamics

本文提出了名为 JEDI 的层次化模型，该模型通过在循环神经网络权重上学习共享嵌入空间，实现了从有限且嘈杂的神经记录中跨任务、跨情境地联合推断和统一建模神经动力学，从而成功揭示了大脑灵活性的潜在机制。

Anirudh Jamkhandi, Ali Korojy, Olivier Codol, Guillaume Lajoie, Matthew G. Perich2026-03-12🧬 q-bio

Naïve Exposure of Generative AI Capabilities Undermines Deepfake Detection

该论文指出，生成式 AI 通过用户界面直接暴露的推理与图像优化能力（尤其是商业聊天机器人），使攻击者仅凭合规提示词即可生成既保留身份特征又具备高感知质量的图像，从而从根本上瓦解了现有深度伪造检测器的有效性，揭示了当前检测框架的威胁模型与真实世界生成式 AI 能力之间的结构性错位。

Sunpill Kim, Chanwoo Hwang, Minsu Kim, Jae Hong Seo2026-03-12🤖 cs.AI

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

该论文提出了一种将图注意力自编码器与大型语言模型（GPT-4o-mini）相结合的轻量级混合框架，通过利用结构推理对 LLM 生成数据进行去噪并优化蒙特卡洛树搜索，在资源受限条件下实现了在亚马逊棋游戏中超越基线及教师模型的高性能决策。

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

该论文提出了名为 IH-Challenge 的强化学习训练数据集，旨在解决大语言模型指令层级冲突的鲁棒性难题，通过微调显著提升了模型在对抗攻击下的安全性与指令遵循能力，并开源了该数据集以推动相关研究。

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI

cs.AI

Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

FAR-Dex: Few-shot Data Augmentation and Adaptive Residual Policy Refinement for Dexterous Manipulation

UniPINN: A Unified PINN Framework for Multi-task Learning of Diverse Navier-Stokes Equations

G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

Modeling Stage-wise Evolution of User Interests for News Recommendation

Aligning Large Language Models with Searcher Preferences

Learning to Negotiate: Multi-Agent Deliberation for Collective Value Alignment in LLMs

JEDI: Jointly Embedded Inference of Neural Dynamics

Naïve Exposure of Generative AI Capabilities Undermines Deepfake Detection

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery

Prompting with the human-touch: evaluating model-sensitivity of foundation models for musculoskeletal CT segmentation

SCORE: Replacing Layer Stacking with Contractive Recurrent Depth

Towards Cognitive Defect Analysis in Active Infrared Thermography with Vision-Text Cues

Adaptive RAN Slicing Control via Reward-Free Self-Finetuning Agents

CUAAudit: Meta-Evaluation of Vision-Language Models as Auditors of Autonomous Computer-Use Agents

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning