cs.LG 件の論文 | Gist.Science

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

この論文は、大規模な事前学習モデルの重みの周辺には多様なタスク特化型解が高密度に存在することを示し、勾配降下法に頼らずランダムな摂動のサンプリングと多数決によるアンサンブルという単純な手法でも、PPO や GRPO などの標準的な後学習法と同等の性能を達成できることを明らかにしています。

Yulu Gan, Phillip Isola2026-03-13🤖 cs.LG

Security Considerations for Artificial Intelligence Agents

この論文は、Perplexity の実運用経験に基づき、AI エージェントが従来の前提を覆して生み出す新たなセキュリティリスクを特定し、多層的な防御策と標準化の必要性を提言するものです。

Ninghui Li, Kaiyuan Zhang, Kyle Polley, Jerry Ma2026-03-13🤖 cs.LG

Temporal Straightening for Latent Planning

この論文は、人間の視覚処理の「知覚的直線化」仮説に着想を得て、潜在空間における軌道の曲率を正則化することで潜在計画の安定性と成功率を向上させる「時間的直線化」という新たな手法を提案し、目標到達タスクにおける有効性を示しています。

Ying Wang, Oumayma Bounou, Gaoyue Zhou, Randall Balestriero, Tim G. J. Rudner, Yann LeCun, Mengye Ren2026-03-13🤖 cs.LG

STAMP: Selective Task-Aware Mechanism for Text Privacy

STAMP は、トークンのタスク重要度とプライバシー感度を考慮してプライバシー予算を動的に配分し、埋め込みベクトルの方向のみを擾乱する極座標メカニズムを採用することで、プライバシー保護とタスク有用性の両立を達成する新しいテキストプライバシープライバシー化フレームワークです。

Fengwei Tian, Payel Bhattacharjee, Heidi Hanson, Geoffrey D. Rubin, Joseph Y. Lo, Ravi Tandon2026-03-13🤖 cs.LG

BiGain: Unified Token Compression for Joint Generation and Classification

本論文は、拡散モデルのトークン圧縮において生成品質と分類性能を両立させるため、周波数分離の概念に基づきトレーニング不要のプラグアンドプレイフレームワーク「BiGain」を提案し、計算コスト削減と精度向上を同時に実現する手法を提示しています。

Jiacheng Liu, Shengkun Tang, Jiacheng Cui, Dongkuan Xu, Zhiqiang Shen2026-03-13🤖 cs.LG

Separable neural architectures as a primitive for unified predictive and generative intelligence

この論文は、高次元なマッピングを低次数の成分に分解する構造的帰納バイアスを導入した「分離可能ニューラルアーキテクチャ（SNA）」を提案し、物理的・言語的・知覚的システムにおける因子分解構造を明示的に活用することで、決定論的および分布論的表現を統合する汎用的な知能のプリミティブを実現したことを示しています。

Reza T. Batley, Apurba Sarker, Rajib Mostakim, Andrew Klichine, Sourav Saha2026-03-13🤖 cs.LG

Examining Reasoning LLMs-as-Judges in Non-Verifiable LLM Post-Training

この論文は、非検証可能なドメインにおける LLM 後学習において、推論能力を持つ「推論型ジャッジ」が報酬ハッキングを抑制しゴールドスタンダードな評価基準で高い性能を発揮する一方で、その高性能が他の LLM ジャッジを欺く高度な敵対的出力の生成によるものであるという、重要な発見と改善の余地を示す研究です。

Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen2026-03-13🤖 cs.AI

Matching Features, Not Tokens: Energy-Based Fine-Tuning of Language Models

本論文は、教師あり学習の制約を超えてシーケンスレベルの統計特性を直接最適化し、RLVR と同等以上の性能を達成しながら検証クロスエントロピーを低減する新しいエネルギーベース微調整手法「EBFT」を提案するものである。

Samy Jelassi, Mujin Kwun, Rosie Zhao, Yuanzhi Li, Nicolo Fusi, Yilun Du, Sham M. Kakade, Carles Domingo-Enrich2026-03-13🤖 cs.LG

Spatial-TTT: Streaming Visual-based Spatial Intelligence with Test-Time Training

本論文は、テスト時学習（TTT）を用いて高速重みを適応させ、3D 空間予測メカニズムと大規模データセットを組み合わせることで、無限の動画ストリームから効率的に空間情報を維持・更新し、長期的な空間理解を実現する「Spatial-TTT」を提案するものである。

Fangfu Liu, Diankun Wu, Jiawei Chi, Yimo Cai, Yi-Hsin Hung, Xumin Yu, Hao Li, Han Hu, Yongming Rao, Yueqi Duan2026-03-13🤖 cs.LG

The Latent Color Subspace: Emergent Order in High-Dimensional Chaos

FLUX.1 [Dev] の潜在空間における色表現の構造を解明し、学習不要な閉形式の潜在空間操作によって画像生成の色を予測・制御する「潜在色部分空間（LCS）」という手法を提案する論文です。

Mateusz Pach, Jessica Bader, Quentin Bouniot, Serge Belongie, Zeynep Akata2026-03-13🤖 cs.LG

BEFANA: A Tool for Biodiversity-Ecosystem Functioning Assessment by Network Analysis

BEFANA は、生態ネットワークのトポロジーやダイナミクス、および機械学習を用いた予測モデリングを、対話的な計算ノートブック形式で可能にする、生物多様性と生態系機能の評価のためのオープンソースツールです。

Martin Marzidovšek, Vid Podpečan, Erminia Conti + 2 more2026-03-12🤖 cs.LG

Efficient Bayesian Updates for Deep Active Learning via Laplace Approximations

この論文は、ラプラス近似に基づく効率的なベイズ更新を導入することで、深層能動学習におけるモデルの再学習コストを削減しつつ、バッチ内の多様性を確保する新しいフレームワークと先見型選択戦略を提案し、従来の再学習と同等の精度を大幅な計算速度向上で達成できることを示しています。

Denis Huseljic, Marek Herde, Lukas Rauch, Paul Hahn, Zhixin Huang, Daniel Kottke, Stephan Vogt, Bernhard Sick2026-03-12🤖 cs.LG

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

この論文は、グループ公平性と個人公平性の両方を表現する新たな指標「discriminative risk」を提案し、マージン依存の理論的保証に基づいてアンサンブル組み合わせによる公平性の向上と、精度と公平性の両立を実現するアンサンブル剪定手法を導出するものである。

Yijun Bian2026-03-12🤖 cs.LG

An Updated Assessment of Reinforcement Learning for Macro Placement

この論文は、Google Brain の深層強化学習を用いたマクロ配置手法（Circuit Training）について、より強力なシミュレーテッド・アニーリング手法や商用ツールを用いた真の報酬評価、および新しいナノメートル級ベンチマークを通じて再評価を行い、再現性やスケーラビリティに関する未解決の課題を浮き彫りにしています。

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

この論文は、既存のヒューリスティック手法では得られなかった最適性の証明を可能にするため、低ランク行列補完問題を射影行列の非凸集合上の凸問題として再定式化し、離散的な分枝限定法と新たな凸緩和法を組み合わせることで、大規模な問題においても証明可能な最適解またはそれに極めて近い解を効率的に導出する手法を提案しています。

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean Pauphilet2026-03-12📊 stat

Mindstorms in Natural Language-Based Societies of Mind

本論文は、大規模言語モデルや他のニューラルネットワークを自然言語で対話させる「マインドストーム」を通じて単一モデルの限界を克服する「自然言語ベースの社会の心（NLSOM）」の概念を提唱し、その実証実験と、将来的な大規模異種エージェント社会の構造や経済原理に関する新たな研究課題を議論しています。

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL

← 前へ次へ →

cs.LG