cs.LG 件の論文 | Gist.Science

Improving Conditional VAE with Non-Volume Preserving transformations

この論文は、潜在空間の条件付き分布を推定するために非体積保存変換（NVP）を導入し、ガウスデコーダの分散を学習可能なパラメータとして扱うことで、従来の条件付き VAE が抱えるぼやけや多様性の欠如を解消し、FID を 4% 改善、対数尤度を 7.6% 向上させる新しい画像生成手法を提案しています。

Tuhin Subhra De2026-03-10🤖 cs.LG

Tight Robustness Certification Through the Convex Hull of $\ell_0$ Attacks

この論文は、 $\ell_0$ 攻撃の凸包が特定の多面体で近似でき、その上での線形境界伝播を用いることで、既存の $\ell_0$ 堅牢性検証器を最大 7 倍高速化しつつ、より Tight な検証を可能にする手法を提案しています。

Yuval Shapira, Dana Drachsler-Cohen2026-03-10🤖 cs.LG

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

この論文は、双曲空間の幾何学的特性、特に角度成分に焦点を当てた勾配符号法（Angular Gradient Sign Method）を提案し、従来のユークリッド空間ベースの攻撃よりも効果的な敵対的攻撃を実現すると同時に、階層的埋め込みの脆弱性を解明するものです。

Minsoo Jo, Dongyoon Yang, Taesup Kim2026-03-10🤖 cs.LG

Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM

本論文は、現実的な攻撃成功率モデルを統合した確率的な「(k, ε)-不安定性」の概念を導入することで、従来厳しすぎる仮定に依存していた SmoothLLM の防御証明を、より実用的で信頼性の高いものへと改良する枠組みを提案しています。

Adarsh Kumarappan, Ayushi Mehrotra2026-03-10🤖 cs.LG

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

この論文は、心理的原理（特に「足がかり効果」）に基づく大規模な多ターン対話型ジャイルブレイク攻撃を自動化するパイプラインを提案し、GPT 系モデルが会話履歴に脆弱である一方で Gemini 2.5 Flash が極めて高い耐性を示すなど、主要 LLM 間の安全性に顕著な差があることを実証しています。

Adarsh Kumarappan, Ananya Mujoo2026-03-10🤖 cs.LG

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

この論文は、学習データに存在するスパースな相関（ショートカット）に依存して分布外一般化性能が低下する深層学習の問題に対し、ラベルと強く相関する潜在空間の軸を特定し、その方向に異方性ノイズを注入して分類器の感度を正則化することで、ショートカットラベルや矛盾するサンプルを必要とせずに分布外一般化性能を向上させる手法を提案しています。

Shivam Pal, Sakshi Varshney, Piyush Rai2026-03-10🤖 cs.LG

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

この論文は、Kaggle 競技を通じて多様なアーキテクチャを探索し、それらを気候モデルに統合した結果、低解像度の現実地理環境におけるオンライン安定性が再現可能となり、ハイブリッドな物理・AI 気候シミュレーションの進展に寄与したことを報告しています。

Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard2026-03-10🤖 cs.LG

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

この論文は、因果推論における論理的欠陥の批判的検討と合意形成を目的とした二エージェント対話フレームワーク「CRAwDAD」を提案し、CLadder ベンチマークにおいて DeepSeek-R1 や Qwen3 などの推論モデルの精度を大幅に向上させることを実証しています。

Finn G. Vamosi, Nils D. Forkert2026-03-10🤖 cs.LG

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

この論文は、3D マイクロ CT スキャンから得られた 2D 画像を用いて有孔虫の種を分類する高精度な深層学習フレームワーク「ForamDeepSlice」を提案し、95.64% のテスト精度を達成するとともに、実用的なデプロイを可能にするインタラクティブなダッシュボードを開発したことを報告しています。

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG

AltNet: Addressing the Plasticity-Stability Dilemma in Reinforcement Learning

本論文は、強化学習における可塑性の喪失問題を解決し、性能低下を伴わずに学習能力を回復させるため、アクティブなネットワークとオフポリシー学習を行うパッシブなネットワークを交互に切り替える「AltNet」という双子ネットワーク手法を提案し、高次元制御タスクにおいて既存手法を上回る性能を実証したものである。

Mansi Maheshwari, John C. Raisbeck, Bruno Castro da Silva2026-03-10🤖 cs.LG

MSPT: Efficient Large-Scale Physical Modeling via Parallelized Multi-Scale Attention

本論文は、ボール木を用いて不規則な幾何学形状をパッチに分割し、局所的な点注意とパッチレベルのグローバル注意を組み合わせることで、単一 GPU で数百万の点にスケール可能な物理シミュレーション手法「MSPT」を提案し、広範な PDE ベンチマークおよび大規模空力データセットにおいて、従来手法を上回る精度を低いメモリ消費と計算コストで達成することを示しています。

Pedro M. P. Curvo, Jan-Willem van de Meent, Maksim Zhdanov2026-03-10🤖 cs.LG

Dual Randomized Smoothing: Beyond Global Noise Variance

この論文は、入力依存のノイズ分散を可能にする「二重ランダム化平滑化」フレームワークを提案し、従来のグローバル分散の限界を克服して小・大半径の両方において高い頑健性を達成する手法を提示しています。

Chenhao Sun, Yuhao Mao, Martin Vechev2026-03-10🤖 cs.LG

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

この論文は、クロスドメインオフライン強化学習における訓練時とテスト時の両方の動的シフトに対する頑健性を向上させるため、新しいロバスト・ベルマン演算子と二つの補正技術を組み合わせた「DROCO」というアルゴリズムを提案し、その有効性を示しています。

Zhongjian Qiao, Rui Yang, Jiafei Lyu, Xiu Li, Zhongxiang Dai, Zhuoran Yang, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

Evolving Diffusion and Flow Matching Policies for Online Reinforcement Learning

この論文は、最適化と生成を分離するという構造的な原則に基づき、表現力豊かな生成モデルとオンライン強化学習の安定性を両立させる新しいフレームワーク「GoRL」を提案し、複雑な連続制御タスクにおいて既存の手法を大幅に上回る性能を達成したことを報告しています。

Chubin Zhang, Zhenglin Wan, Feng Chen, Fuchao Yang, Lang Feng, Yaxin Zhou, Xingrui Yu, Yang You, Ivor Tsang, Bo An2026-03-10🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

この論文は、非加法的な現実世界の報酬構造や高次元のスパース性を扱うために、単一化された非線形説明フレームワーク「疎性等方性シャプレー回帰（SISR）」を提案し、単調変換の学習とスパース性制約を同時に実行することで、既存のシャプレー値の歪みを解消し、理論的保証と高い実用性を両立させることを示しています。

Jialai She2026-03-10🤖 cs.LG

Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real

制約されたリソースとデータ制約下で、ルールベースのマスク変形と GAN による画像変換を組み合わせる二段階のデータ拡張フレームワークを提案し、限られたデータ量でもマスク付き顔検出・認識タスクにおいて既存手法を上回る結果を示した研究です。

Yan Yang, George Bebis, Mircea Nicolescu2026-03-10🤖 cs.LG

SALVE: Sparse Autoencoder-Latent Vector Editing for Mechanistic Control of Neural Networks

本論文は、スパースオートエンコーダと勾配ベースの可視化手法を統合し、深層学習モデルの内部特徴を「発見・検証・制御」する SALVE 枠組みを提案することで、モデルの透明性と制御性を高める新たな手法を提示しています。

Vegard Flovik2026-03-10🤖 cs.LG

Meta-RL Induces Exploration in Language Agents

本論文は、エピソード横断的なトレーニングとリフレクションによるコンテキスト内方策適応という 2 つの主要な構成要素を備えたメタ強化学習フレームワーク「LaMer」を提案し、これにより言語エージェントが環境からのフィードバックに基づいて能動的に探索し、従来の強化学習ベースラインよりも Sokoban や Webshop などのタスクで顕著な性能向上と汎化能力を実現することを示しています。

Yulun Jiang, Liangze Jiang, Damien Teney, Michael Moor, Maria Brbic2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

本論文は、拡散モデルの事前知識と形状からの陰影（SfS）の手がかりを組み合わせ、推論時に自己教師ありで再照明を行う「Re-Depth Anything」を提案し、Depth Anything V2 や V3 の推定深度をラベルなしで高精度かつリアルに洗練させる手法を提示するものである。

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

本論文は、逐次的な制約により並列化が困難だったニュートン・カチャルツ法に基づくコルモゴロフ・アルノルドネットワークの学習アルゴリズムに対し、事前学習、データ分割によるモデル統合、およびFPGA実装という3つの戦略を提案することで、並列処理による大幅な高速化を実現したことを示しています。

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG

← 前へ次へ →

cs.LG