cs.AI 件の論文 | Gist.Science

Stabilizing Reinforcement Learning for Diffusion Language Models

この論文は、拡散言語モデルへの GRPO の直接適用で発生する報酬崩壊を、確率比推定に伴うノイズによる不安定性を解消する「StableDRL」という新しい手法と階段型アテンション機構によって解決し、拡散モデルの安定した強化学習を可能にすることを提案しています。

Jianyuan Zhong, Kaibo Wang, Ding Ding, Zijin Feng, Haoli Bai, Yang Xiang, Jiacheng Sun, Qiang Xu2026-03-10🤖 cs.LG

Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection

この論文は、過剰な誘導による品質低下を防ぐために、妥当性に基づく復号ループと軽量な層分析を用いて動的に誘導強度を調整する新しい手法「DIRECTER」を提案し、追加データなしでLLMの指示追従能力を大幅に向上させることを示しています。

Minjae Kang, Jaehyung Kim2026-03-10🤖 cs.LG

ButterflyViT: 354 $\times$ Expert Compression for Edge Vision Transformers

本論文は、エッジデバイス向けにビジョントランスフォーマーの専門家（エキスパート）を独立した重み行列ではなく共有基底からの幾何学的な再配向として表現する「ButterflyViT」を提案し、64 個の専門家において精度をほぼ損なうことなくメモリ使用量を 354 倍削減することに成功したことを報告しています。

Aryan Karmore2026-03-10💻 cs

Property-driven Protein Inverse Folding With Multi-Objective Preference Alignment

本論文は、設計可能性を損なうことなく溶解性や熱安定性などの多様な開発特性を同時に満たすよう事前学習済み逆フォールディングモデルを微調整する多目的選好アライメントフレームワーク「ProtAlign」を提案し、その実用性を示すものである。

Xiaoyang Hou, Junqi Liu, Chence Shi, Xin Liu, Zhi Yang, Jian Tang2026-03-10🤖 cs.LG

Robotic Foundation Models for Industrial Control: A Comprehensive Survey and Readiness Assessment Framework

本論文は、産業用ロボットの制御における基盤モデルの現状を包括的に調査し、149 の具体的な基準からなる評価フレームワークを用いて 324 件のモデルを評価した結果、産業応用への成熟度は限定的であり、安全性やリアルタイム性、システム統合などの要素を体系的に組み込むことが不可欠であると結論付けています。

David Kube, Simon Hadwiger, Tobias Meisen2026-03-10💻 cs

XMACNet: An Explainable Lightweight Attention based CNN with Multi Modal Fusion for Chili Disease Classification

本論文は、可視画像と植生指数を融合し、自己注意機構と Grad-CAM++ などの説明可能性手法を組み合わせた軽量 CNN「XMACNet」を提案し、合成データ拡張により構築した新たな唐辛子病害データセット上で、既存モデルを上回る高精度かつ解釈可能な病害分類を実現したことを報告しています。

Tapon Kumer Ray, Rajkumar Y, Shalini R, Srigayathri K, Jayashree S, Lokeswari P2026-03-10💻 cs

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

この論文は、不均衡なデータにおける概念ドリフト検出時に生じる「マスキング効果」を回避し、小規模な概念のドリフトを解釈可能かつロバストに検出するための、偏りのないクラスター記述子に基づく新しい手法「ICD3」を提案するものである。

Yiqun Zhang, Zhanpei Huang, Mingjie Zhao, Chuyao Zhang, Yang Lu, Yuzhu Ji, Fangqing Gu, An Zeng2026-03-10🤖 cs.LG

Enhancing SHAP Explainability for Diagnostic and Prognostic ML Models in Alzheimer Disease

この論文は、アルツハイマー病の診断・予後モデルにおけるSHAP説明の堅牢性と一貫性を検証する多段階フレームワークを提案し、認知・機能マーカーが説明の主要因であり、診断と予後の間でSHAP説明が安定して転用可能であることを示した。

Pablo Guillén, Enrique Frias-Martinez2026-03-10🤖 cs.LG

Gradient-based Nested Co-Design of Aerodynamic Shape and Control for Winged Robots

本論文は、空力形状と運動計画を個別に最適化する従来の手法の限界を克服し、ニューラルネットワークによる空力近似と勾配法に基づくネスト型共設計フレームワークを提案することで、固定翼グライダーの着地や着座といった複雑なタスクにおいて、進化アルゴリズムよりも短時間で高性能な設計を実現することを示しています。

Daniele Affinita, Mingda Xu, Benoît Valentin Gherardi, Pascal Fua2026-03-10💻 cs

Diversity-Aware Adaptive Collocation for Physics-Informed Neural Networks via Sparse QUBO Optimization and Hybrid Coresets

本論文は、物理情報ニューラルネットワーク（PINN）の訓練効率と精度を向上させるため、残差に基づく重要性と多様性を同時に考慮し、スパースな QUBO 最適化とハイブリッドなコアセット構築を用いて適応的な配置点選択を行う新たな手法を提案し、粘性ブルガース方程式のシミュレーションにおいてその有効性を検証したものである。

Hadi Salloum, Maximilian Mifsud Bonici, Sinan Ibrahim, Pavel Osinenko, Alexei Kornaev2026-03-10🤖 cs.LG

Failure Detection in Chemical Processes using Symbolic Machine Learning: A Case Study on Ethylene Oxidation

この論文は、安全性が極めて重要な化学プロセス分野において、説明性と解釈性を備えつつ、実世界の故障データが不足している状況でもシミュレータデータを用いてランダムフォレストや多層パーセプトロンを上回る性能を発揮する記号機械学習による故障検知手法の可行性を、エチレン酸化プロセスの事例研究を通じて検証したものである。

Julien Amblard, Niklas Groll, Matthew Tait, Mark Law, Gürkan Sin, Alessandra Russo2026-03-10🤖 cs.LG

HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

本論文は、ジョブショップスケジューリング問題を異種グラフとしてモデル化し、エッジの種類の違いを考慮した異種グラフトランスフォーマーを用いた強化学習フレームワーク「HGT-Scheduler」を提案し、その有効性をベンチマークインスタンスで実証したものである。

Bulent Soykan2026-03-10🤖 cs.LG

SpatialMAGIC: A Hybrid Framework Integrating Graph Diffusion and Spatial Attention for Spatial Transcriptomics Imputation

SpatialMAGIC は、グラフ拡散とトランスフォーマーに基づく空間自己注意力を統合したハイブリッド枠組みにより、空間トランスクリプトミクスデータの欠損値を高精度に補完し、細胞クラスタリングの精度向上や生物学的解釈性の維持を実現する手法として提案されています。

Sayeem Bin Zaman, Fahim Hafiz, Riasat Azim2026-03-10🤖 cs.LG

← 前へ次へ →

cs.AI

Stabilizing Reinforcement Learning for Diffusion Language Models

Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection

ButterflyViT: 354 $\times$ Expert Compression for Edge Vision Transformers

Property-driven Protein Inverse Folding With Multi-Objective Preference Alignment

Robotic Foundation Models for Industrial Control: A Comprehensive Survey and Readiness Assessment Framework

XMACNet: An Explainable Lightweight Attention based CNN with Multi Modal Fusion for Chili Disease Classification

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

Enhancing SHAP Explainability for Diagnostic and Prognostic ML Models in Alzheimer Disease

Gradient-based Nested Co-Design of Aerodynamic Shape and Control for Winged Robots

Diversity-Aware Adaptive Collocation for Physics-Informed Neural Networks via Sparse QUBO Optimization and Hybrid Coresets

Failure Detection in Chemical Processes using Symbolic Machine Learning: A Case Study on Ethylene Oxidation

HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

SpatialMAGIC: A Hybrid Framework Integrating Graph Diffusion and Spatial Attention for Spatial Transcriptomics Imputation

xaitimesynth: A Python Package for Evaluating Attribution Methods for Time Series with Synthetic Ground Truth

Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data

Optimistic Policy Regularization

Best-of-Tails: Bridging Optimism and Pessimism in Inference-Time Alignment

Breaking the Martingale Curse: Multi-Agent Debate via Asymmetric Cognitive Potential Energy

A Hybrid Machine Learning Model for Cerebral Palsy Detection

Making AI Evaluation Deployment Relevant Through Context Specification

cs.AI

Stabilizing Reinforcement Learning for Diffusion Language Models

Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection

ButterflyViT: 354×\times× Expert Compression for Edge Vision Transformers

Property-driven Protein Inverse Folding With Multi-Objective Preference Alignment

Robotic Foundation Models for Industrial Control: A Comprehensive Survey and Readiness Assessment Framework

XMACNet: An Explainable Lightweight Attention based CNN with Multi Modal Fusion for Chili Disease Classification

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

Enhancing SHAP Explainability for Diagnostic and Prognostic ML Models in Alzheimer Disease

Gradient-based Nested Co-Design of Aerodynamic Shape and Control for Winged Robots

Diversity-Aware Adaptive Collocation for Physics-Informed Neural Networks via Sparse QUBO Optimization and Hybrid Coresets

Failure Detection in Chemical Processes using Symbolic Machine Learning: A Case Study on Ethylene Oxidation

HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers

SpatialMAGIC: A Hybrid Framework Integrating Graph Diffusion and Spatial Attention for Spatial Transcriptomics Imputation

xaitimesynth: A Python Package for Evaluating Attribution Methods for Time Series with Synthetic Ground Truth

Physics-Informed Diffusion Model for Generating Synthetic Extreme Rare Weather Events Data

Optimistic Policy Regularization

Best-of-Tails: Bridging Optimism and Pessimism in Inference-Time Alignment

Breaking the Martingale Curse: Multi-Agent Debate via Asymmetric Cognitive Potential Energy

A Hybrid Machine Learning Model for Cerebral Palsy Detection

Making AI Evaluation Deployment Relevant Through Context Specification

ButterflyViT: 354 $\times$ Expert Compression for Edge Vision Transformers