cs.LG 件の論文 | Gist.Science

ContextBench: Modifying Contexts for Targeted Latent Activation

この論文は、言語モデルの特定の潜在特徴や動作を誘発する入力生成手法を「文脈修正」として定式化し、その能力と安全性への応用を評価するベンチマーク「ContextBench」を提案するとともに、LLM 支援や拡散モデルによる修正を加えた進化型プロンプト最適化（EPO）が、誘発効果と言語的流暢さのバランスにおいて最先端のパフォーマンスを達成することを示しています。

Robert Graham, Edward Stevinson, Leo Richter, Alexander Chia, Joseph Miller, Joseph Isaac Bloom2026-03-09🤖 cs.AI

Sysformer: Safeguarding Frozen Large Language Models with Adaptive System Prompts

本論文は、大規模言語モデル（LLM）の重みを固定したまま、ユーザーの入力に応じてシステムプロンプトを適応的に調整する「Sysformer」というトランスフォーマーモデルを提案し、有害な入力への拒否率や安全な入力への対応精度を大幅に向上させ、高度な脱獄攻撃に対しても堅牢性を高めることを実証しています。

Kartik Sharma, Yiqiao Jin, Vineeth Rakesh, Yingtong Dou, Menghai Pan, Mahashweta Das, Srijan Kumar2026-03-09🤖 cs.AI

SPoT: Subpixel Placement of Tokens in Vision Transformers

この論文は、従来のグリッド制約を回避し、画像内でトークンを連続的に配置する「SPoT」という新しいトークン化手法を提案し、理想的なサブピクセル配置の探索を通じて、必要なトークン数を大幅に削減しながら高い精度を達成するビジョン・トランスフォーマーの新たな可能性を示しています。

Martine Hjelkrem-Tan, Marius Aasan, Gabriel Y. Arteaga, Adín Ramírez Rivera2026-03-09🤖 cs.LG

Quantifying Cross-Attention Interaction in Transformers for Interpreting TCR-pMHC Binding

本論文は、T 細胞受容体と pMHC の結合を解釈可能にするため、エンコーダ - デコーダ型トランスフォーマーのクロスアテンション機構を定量化する新たな手法「QCAI」を提案し、実験的に決定された 274 個の構造データから構築したベンチマーク「TCR-XAI」を用いて、既存手法を上回る解釈性と予測精度を達成したことを示しています。

Jiarui Li, Zixiang Yin, Haley Smith, Zhengming Ding, Samuel J. Landry, Ramgopal R. Mettu2026-03-09🤖 cs.LG

Temporal Misalignment Attacks against Multimodal Perception in Autonomous Driving

本論文は、自動運転のマルチモーダル知覚システムにおける時間同期の脆弱性を突いた新たな攻撃「DejaVu」を提案し、車載ネットワークを介した微妙な時間的ズレが物体検出や追跡の精度を劇的に低下させ、衝突や誤作動ブレーキなどの深刻な物理的被害を引き起こす可能性を実証したものである。

Md Hasan Shahriar, Md Mohaimin Al Barat, Harshavardhan Sundar, Ning Zhang, Naren Ramakrishnan, Y. Thomas Hou, Wenjing Lou2026-03-09🤖 cs.LG

Diverse and Adaptive Behavior Curriculum for Autonomous Driving: A Student-Teacher Framework with Multi-Agent RL

この論文は、教師がグラフベースのマルチエージェント強化学習を用いて自動運転エージェントの性能に応じて適応的に交通行動を生成する「生徒 - 教師フレームワーク」を提案し、これによりルールベースの交通シナリオに依存する従来の手法よりも汎化性と堅牢性に優れた自動運転ポリシーの学習を実現することを示しています。

Ahmed Abouelazm, Johannes Ratz, Philip Schörner, J. Marius Zöllner2026-03-09🤖 cs.LG

Merging Memory and Space: A State Space Neural Operator

この論文は、適応的減衰と学習可能な周波数変調を導入して時間依存偏微分方程式の解演算子を効率的に学習する「状態空間ニューラル演算子（SS-NO）」を提案し、理論的な普遍性の証明と、多様な PDE 基準における最先端の性能とパラメータ効率の両立を実証しています。

Nodens Koren, Samuel Lanthaler2026-03-09🤖 cs.LG

Multivariate Fields of Experts for Convergent Image Reconstruction

この論文は、 $\ell_\infty$ ノルムのモレウエンベロープを用いて構築された多変量ポテンシャル関数を取り入れた「多変量エキスパートの場（Multivariate Fields of Experts）」という新しい画像事前分布学習フレームワークを提案し、深層学習ベースの正則化器に近い性能をより少ないパラメータとデータで、かつ理論的な収束保証を備えた高速な手法で達成することを示しています。

Stanislas Ducotterd, Michael Unser2026-03-09🤖 cs.LG

Characterizing Evolution in Expectation-Maximization Estimates for Overspecified Mixed Linear Regression

本論文は、過剰指定された 2 成分混合線形回帰モデルにおける EM アルゴリズムの挙動を理論的に解析し、混合重みの初期推定値が不均衡か均衡かによって、回帰パラメータの収束速度（線形対亜線形）および有限サンプルにおける統計的精度が異なることを明らかにしています。

Zhankun Luo, Abolfazl Hashemi2026-03-09🤖 cs.LG

Kernel VICReg for Self-Supervised Learning in Reproducing Kernel Hilbert Space

本論文は、自己教師あり学習の VICReg 目的関数を再生核ヒルベルト空間に拡張した「Kernel VICReg」を提案し、非線形構造のデータやサンプル数が限られる環境において、従来のユークリッド空間ベースの手法よりも優れた表現学習とモデルの崩壊防止を実現することを示しています。

M. Hadi Sepanj, Benyamin Ghojogh, Saed Moradi, Paul Fieguth2026-03-09🤖 cs.LG

One Model for All Tasks: Leveraging Efficient World Models in Multi-Task Planning

本論文は、勾配競合を軽減する混合専門家（MoE）アーキテクチャと、学習過程で動的にモデル容量を拡張するオンライン動的パラメータスケーリング（DPS）戦略を組み合わせることで、単一のモデルで多様なタスクにおける効率的な計画を実現する「ScaleZero」を提案し、専門的な単一タスクエージェントと同等の性能を環境相互作用を大幅に削減しながら達成することを示しています。

Yuan Pu, Yazhe Niu, Jia Tang, Junyu Xiong, Shuai Hu, Hongsheng Li2026-03-09🤖 cs.LG

Quantum parameter estimation with uncertainty quantification from continuous measurement data using neural network ensembles

この論文は、連続測定データを用いた量子パラメータ推定において、深層アンサンブル学習が従来の機械学習手法では失われていたベイズ推論の利点である不確実性の定量化を可能にし、かつ推論速度の向上やデータドリフトの検出も実現できることを示しています。

Amanuel Anteneh2026-03-09⚛️ quant-ph

← 前へ次へ →

cs.LG

ContextBench: Modifying Contexts for Targeted Latent Activation

Sysformer: Safeguarding Frozen Large Language Models with Adaptive System Prompts

SPoT: Subpixel Placement of Tokens in Vision Transformers

Quantifying Cross-Attention Interaction in Transformers for Interpreting TCR-pMHC Binding

Temporal Misalignment Attacks against Multimodal Perception in Autonomous Driving

Diverse and Adaptive Behavior Curriculum for Autonomous Driving: A Student-Teacher Framework with Multi-Agent RL

Merging Memory and Space: A State Space Neural Operator

Multivariate Fields of Experts for Convergent Image Reconstruction

Characterizing Evolution in Expectation-Maximization Estimates for Overspecified Mixed Linear Regression

Kernel VICReg for Self-Supervised Learning in Reproducing Kernel Hilbert Space

One Model for All Tasks: Leveraging Efficient World Models in Multi-Task Planning

Quantum parameter estimation with uncertainty quantification from continuous measurement data using neural network ensembles

Reasoned Safety Alignment: Ensuring Jailbreak Defense via Answer-Then-Check

VEGA: Electric Vehicle Navigation Agent via Physics-Informed Neural Operator and Proximal Policy Optimization

Spectral/Spatial Tensor Atomic Cluster Expansion with Universal Embeddings in Cartesian Space

C^2Prompt: Class-aware Client Knowledge Interaction for Federated Continual Learning

Auto-Regressive U-Net for Full-Field Prediction of Shrinkage-Induced Damage in Concrete

Taxonomy-aware Dynamic Motion Generation on Hyperbolic Manifolds

Planner Aware Path Learning in Diffusion Language Models Training

Diffusion Alignment as Variational Expectation-Maximization