Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks

本論文は、GAN と FGSM による敵対的攻撃を想定し、スタッキング分類器とオートエンコーダを多層的に組み合わせ、敵対的訓練を適用することで、機械学習ベースのネットワーク侵入検知システム(NIDS)の耐性を向上させる手法を提案し、UNSW-NB15 と NSL-KDD データセットを用いた実験でその有効性を示しています。

Nasim Soltani, Shayan Nejadshamsi, Zakaria Abou El Houda, Raphael Khoury, Kelton A. P. Costa, Tiago H. Falk, Anderson R. Avila2026-03-12🤖 cs.AI

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

本論文は、異なる運転条件における分布の不一致を解決するため、劣化段階を同期させたバッチサンプリングと大規模カーネルおよびクロスアテンションを統合した自動符号化器を提案し、異分野適応に基づく高品質な健全性指標の学習を実現する手法を提示しています。

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

この論文は、FP4 量子化された LLM 学習における数値的不安定性の主要因がランク 1 の平均バイアスに起因することを発見し、これを単純な平均値の引き算で除去することで、SVD などの複雑な手法を避けつつ BF16 並みの安定性と性能を回復させる効率的な手法を提案しています。

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

FAR-Dex: Few-shot Data Augmentation and Adaptive Residual Policy Refinement for Dexterous Manipulation

この論文は、限られたデモンストレーションから物理的に制約された軌道を生成するデータ拡張手法と、多段階の軌道セグメントと観測特徴を組み合わせて方策を適応的に微調整する残差モジュールを統合した階層的フレームワーク「FAR-Dex」を提案し、シミュレーションおよび実世界における多指ハンドとアームの協調操作の成功率と汎化性能を大幅に向上させることを示しています。

Yushan Bai, Fulin Chen, Hongzheng Sun, Yuchuang Tong, En Li, Zhengtao Zhang2026-03-12🤖 cs.AI

UniPINN: A Unified PINN Framework for Multi-task Learning of Diverse Navier-Stokes Equations

本論文は、単一フロー設定に限定されがちな既存の物理情報ニューラルネットワーク(PINN)の課題を克服し、共有・専門化アーキテクチャ、クロスフロー注意機構、動的重み割り当て戦略を統合することで、多様なナビエ・ストークス方程式のマルチタスク学習において高精度かつ安定した予測を実現する統一フレームワーク「UniPINN」を提案するものです。

Dengdi Sun, Jie Chen, Xiao Wang, Jin Tang2026-03-12🤖 cs.AI

G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

本論文は、長尺の複数話者音声における時間指定付き話者割り当て付きASRを実現するため、時間意識型話者追跡モジュールと音声LLMを組み合わせたエンドツーエンドシステム「G-STAR」を提案し、チャンク間の話者同一性の一貫性と微細な時間境界の両方を維持する手法を確立したものである。

Jing Peng, Ziyi Chen, Haoyu Li, Yucheng Wang, Duo Ma, Mengtian Li, Yunfan Du, Dezhu Xu, Kai Yu, Shuai Wang2026-03-12⚡ eess

Modeling Stage-wise Evolution of User Interests for News Recommendation

この論文は、ユーザーの長期的な嗜好と短期的な興味の変遷をそれぞれグローバルおよび局所的な時間的視点から統合的に学習する新しいニュース推薦フレームワークを提案し、実データによる実験で既存手法を上回る性能を実証したものである。

Zhiyong Cheng, Yike Jin, Zhijie Zhang, Huilin Chen, Zhangling Duan, Meng Wang2026-03-12🤖 cs.AI

Aligning Large Language Models with Searcher Preferences

この論文は、検索結果の要約に特化した初の大規模言語モデル「SearchLLM」を提案し、階層的な報酬システムと GRPO による最適化を通じて、RedNote での実装において生成品質とユーザーエンゲージメントの向上、および安全性の維持を実現したことを報告しています。

Wei Wu, Peilun Zhou, Liyi Chen, Qimeng Wang, Chengqiang Lu, Yan Gao, Yi Wu, Yao Hu, Hui Xiong2026-03-12💬 cs.CL

Learning to Negotiate: Multi-Agent Deliberation for Collective Value Alignment in LLMs

この論文は、対立する価値観を持つ複数のエージェントが対話を通じて相互に有益な解決策を導き出す「交渉に基づくマルチエージェント対話」を RL 学習で訓練する枠組みを提案し、これにより単一エージェントの手法と同等の集団的価値整合性を保ちつつ、対立解決能力を大幅に向上させることを実証しています。

Panatchakorn Anantaprayoon, Nataliia Babina, Nima Asgharbeygi, Jad Tarifi2026-03-12💬 cs.CL

Naïve Exposure of Generative AI Capabilities Undermines Deepfake Detection

この論文は、ユーザーが商用生成 AI のチャットボットに対して安全なプロンプトで画像の精緻化を依頼するだけで、現代のディープフェイク検出器を回避しつつ高品質な偽造画像を生成できてしまうという、検出フレームワークの脅威モデルと実世界の AI 能力の間の構造的な不一致を明らかにしています。

Sunpill Kim, Chanwoo Hwang, Minsu Kim, Jae Hong Seo2026-03-12🤖 cs.AI

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

本論文は、大規模言語モデルの生成能力とグラフ注意メカニズムを統合した軽量ハイブリッド枠組みを提案し、限られた計算資源下でも「アマゾンズ」ゲームにおいて教師モデルを上回る高性能な意思決定を実現することを示しています。

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

この論文は、LLM における指示階層(IH)の堅牢性を向上させるための強化学習用データセット「IH-Challenge」を提案し、GPT-5-Mini への適用により安全性と有用性を大幅に改善しつつ能力の低下を最小限に抑えたことを報告しています。

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI

UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery

この論文は、部分的に観測可能なマルコフ決定過程(POMDP)として定式化した医療物資の時間的制約付き配送問題を、近接方策最適化(PPO)を用いたマルチエージェント強化学習フレームワークで解決し、実世界の地理データに基づく実験により古典的 PPO が非同期学習よりも優れた協調性能を示すことを実証しています。

Islam Guven, Mehmet Parlak2026-03-12🤖 cs.LG

Prompting with the human-touch: evaluating model-sensitivity of foundation models for musculoskeletal CT segmentation

この論文は、骨やインプラントのセグメンテーションタスクにおいて、11 種類のプロンプタブル基盤モデルを評価した結果、モデルやプロンプト戦略によって性能が大きく異なり、特に人間のプロンプトを使用すると性能が低下し、モデルがプロンプトのばらつきに敏感であることを示し、人間主導の環境での最適なモデル選出の難しさを浮き彫りにしました。

Caroline Magg, Maaike A. ter Wee, Johannes G. G. Dobbe, Geert J. Streekstra, Leendert Blankevoort, Clara I. Sánchez, Hoel Kervadec2026-03-12🤖 cs.AI

Towards Cognitive Defect Analysis in Active Infrared Thermography with Vision-Text Cues

この論文は、事前学習済みマルチモーダルモデルと軽量アダプターを活用し、大規模な訓練データなしで炭素繊維強化プラスチックの欠陥をゼロショットで検出・可視化する新しい言語誘導型フレームワークを提案し、従来の手法を大幅に上回る性能を実証したものである。

Mohammed Salah, Eman Ouda, Giuseppe Dell'Avvocato, Fabrizio Sarasini, Ester D'Accardi, Jorge Dias, Davor Svetinovic, Stefano Sfarra, Yusra Abdulrahman2026-03-12⚡ eess

Adaptive RAN Slicing Control via Reward-Free Self-Finetuning Agents

この論文は、報酬信号を必要とせず、双方向的な反射メカニズムによる言語フィードバックで長期的な経験をモデルパラメータに定着させる自己微調整フレームワークを提案し、動的な RAN スライシング制御において従来の強化学習や LLM エージェントを上回る性能を実証しています。

Yuanhao Li, Haozhe Wang, Geyong Min, Nektarios Georgalas, Wang Miao2026-03-12🤖 cs.AI

CUAAudit: Meta-Evaluation of Vision-Language Models as Auditors of Autonomous Computer-Use Agents

本論文は、自律型コンピュータ操作エージェント(CUA)の評価にビジョン・言語モデル(VLM)を監査者として用いる手法を大規模に検証し、複雑な環境では精度が低下しモデル間での判断に不一致が生じるなど、現在のモデルベース監査アプローチには根本的な限界があることを明らかにしています。

Marta Sumyk, Oleksandr Kosovan2026-03-12🤖 cs.AI

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

本論文は、道徳的推論におけるアライメントタスクが本質的に多様性を必要とするという仮説を否定し、数学的推論と同様に報酬最大化型の強化学習(RLVR)が効果的であることを、高報酬応答の分布が集中しているという実証的発見を通じて明らかにしています。

Zhaowei Zhang, Xiaohan Liu, Xuekai Zhu, Junchao Huang, Ceyao Zhang, Zhiyuan Feng, Yaodong Yang, Xiaoyuan Yi, Xing Xie2026-03-12🤖 cs.AI