cs.AI 件の論文 | Gist.Science

Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks

本論文は、GAN と FGSM による敵対的攻撃を想定し、スタッキング分類器とオートエンコーダを多層的に組み合わせ、敵対的訓練を適用することで、機械学習ベースのネットワーク侵入検知システム（NIDS）の耐性を向上させる手法を提案し、UNSW-NB15 と NSL-KDD データセットを用いた実験でその有効性を示しています。

Nasim Soltani, Shayan Nejadshamsi, Zakaria Abou El Houda, Raphael Khoury, Kelton A. P. Costa, Tiago H. Falk, Anderson R. Avila2026-03-12🤖 cs.AI

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

本論文は、異なる運転条件における分布の不一致を解決するため、劣化段階を同期させたバッチサンプリングと大規模カーネルおよびクロスアテンションを統合した自動符号化器を提案し、異分野適応に基づく高品質な健全性指標の学習を実現する手法を提示しています。

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

この論文は、FP4 量子化された LLM 学習における数値的不安定性の主要因がランク 1 の平均バイアスに起因することを発見し、これを単純な平均値の引き算で除去することで、SVD などの複雑な手法を避けつつ BF16 並みの安定性と性能を回復させる効率的な手法を提案しています。

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

FAR-Dex: Few-shot Data Augmentation and Adaptive Residual Policy Refinement for Dexterous Manipulation

この論文は、限られたデモンストレーションから物理的に制約された軌道を生成するデータ拡張手法と、多段階の軌道セグメントと観測特徴を組み合わせて方策を適応的に微調整する残差モジュールを統合した階層的フレームワーク「FAR-Dex」を提案し、シミュレーションおよび実世界における多指ハンドとアームの協調操作の成功率と汎化性能を大幅に向上させることを示しています。

Yushan Bai, Fulin Chen, Hongzheng Sun, Yuchuang Tong, En Li, Zhengtao Zhang2026-03-12🤖 cs.AI

UniPINN: A Unified PINN Framework for Multi-task Learning of Diverse Navier-Stokes Equations

本論文は、単一フロー設定に限定されがちな既存の物理情報ニューラルネットワーク（PINN）の課題を克服し、共有・専門化アーキテクチャ、クロスフロー注意機構、動的重み割り当て戦略を統合することで、多様なナビエ・ストークス方程式のマルチタスク学習において高精度かつ安定した予測を実現する統一フレームワーク「UniPINN」を提案するものです。

Dengdi Sun, Jie Chen, Xiao Wang, Jin Tang2026-03-12🤖 cs.AI

G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

本論文は、長尺の複数話者音声における時間指定付き話者割り当て付きASRを実現するため、時間意識型話者追跡モジュールと音声LLMを組み合わせたエンドツーエンドシステム「G-STAR」を提案し、チャンク間の話者同一性の一貫性と微細な時間境界の両方を維持する手法を確立したものである。

Jing Peng, Ziyi Chen, Haoyu Li, Yucheng Wang, Duo Ma, Mengtian Li, Yunfan Du, Dezhu Xu, Kai Yu, Shuai Wang2026-03-12⚡ eess

Modeling Stage-wise Evolution of User Interests for News Recommendation

この論文は、ユーザーの長期的な嗜好と短期的な興味の変遷をそれぞれグローバルおよび局所的な時間的視点から統合的に学習する新しいニュース推薦フレームワークを提案し、実データによる実験で既存手法を上回る性能を実証したものである。

Zhiyong Cheng, Yike Jin, Zhijie Zhang, Huilin Chen, Zhangling Duan, Meng Wang2026-03-12🤖 cs.AI

Aligning Large Language Models with Searcher Preferences

この論文は、検索結果の要約に特化した初の大規模言語モデル「SearchLLM」を提案し、階層的な報酬システムと GRPO による最適化を通じて、RedNote での実装において生成品質とユーザーエンゲージメントの向上、および安全性の維持を実現したことを報告しています。

Wei Wu, Peilun Zhou, Liyi Chen, Qimeng Wang, Chengqiang Lu, Yan Gao, Yi Wu, Yao Hu, Hui Xiong2026-03-12💬 cs.CL

Learning to Negotiate: Multi-Agent Deliberation for Collective Value Alignment in LLMs

この論文は、対立する価値観を持つ複数のエージェントが対話を通じて相互に有益な解決策を導き出す「交渉に基づくマルチエージェント対話」を RL 学習で訓練する枠組みを提案し、これにより単一エージェントの手法と同等の集団的価値整合性を保ちつつ、対立解決能力を大幅に向上させることを実証しています。

Panatchakorn Anantaprayoon, Nataliia Babina, Nima Asgharbeygi, Jad Tarifi2026-03-12💬 cs.CL

JEDI: Jointly Embedded Inference of Neural Dynamics

この論文は、異なるタスクや文脈にわたって神経ダイナミクスを共有埋め込み空間内で学習する階層モデル「JEDI」を提案し、限られた実験データから脳の状態やメカニズムをスケーラブルかつ汎用的に推論できることを示しています。

Anirudh Jamkhandi, Ali Korojy, Olivier Codol, Guillaume Lajoie, Matthew G. Perich2026-03-12🧬 q-bio

Naïve Exposure of Generative AI Capabilities Undermines Deepfake Detection

この論文は、ユーザーが商用生成 AI のチャットボットに対して安全なプロンプトで画像の精緻化を依頼するだけで、現代のディープフェイク検出器を回避しつつ高品質な偽造画像を生成できてしまうという、検出フレームワークの脅威モデルと実世界の AI 能力の間の構造的な不一致を明らかにしています。

Sunpill Kim, Chanwoo Hwang, Minsu Kim, Jae Hong Seo2026-03-12🤖 cs.AI

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

本論文は、大規模言語モデルの生成能力とグラフ注意メカニズムを統合した軽量ハイブリッド枠組みを提案し、限られた計算資源下でも「アマゾンズ」ゲームにおいて教師モデルを上回る高性能な意思決定を実現することを示しています。

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

この論文は、LLM における指示階層（IH）の堅牢性を向上させるための強化学習用データセット「IH-Challenge」を提案し、GPT-5-Mini への適用により安全性と有用性を大幅に改善しつつ能力の低下を最小限に抑えたことを報告しています。

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI

← 前へ次へ →

cs.AI

Enhancing Network Intrusion Detection Systems: A Multi-Layer Ensemble Approach to Mitigate Adversarial Attacks

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

FAR-Dex: Few-shot Data Augmentation and Adaptive Residual Policy Refinement for Dexterous Manipulation

UniPINN: A Unified PINN Framework for Multi-task Learning of Diverse Navier-Stokes Equations

G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition

Modeling Stage-wise Evolution of User Interests for News Recommendation

Aligning Large Language Models with Searcher Preferences

Learning to Negotiate: Multi-Agent Deliberation for Collective Value Alignment in LLMs

JEDI: Jointly Embedded Inference of Neural Dynamics

Naïve Exposure of Generative AI Capabilities Undermines Deepfake Detection

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

UAV-MARL: Multi-Agent Reinforcement Learning for Time-Critical and Dynamic Medical Supply Delivery

Prompting with the human-touch: evaluating model-sensitivity of foundation models for musculoskeletal CT segmentation

SCORE: Replacing Layer Stacking with Contractive Recurrent Depth

Towards Cognitive Defect Analysis in Active Infrared Thermography with Vision-Text Cues

Adaptive RAN Slicing Control via Reward-Free Self-Finetuning Agents

CUAAudit: Meta-Evaluation of Vision-Language Models as Auditors of Autonomous Computer-Use Agents

Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning