cs.LG 件の論文 | Gist.Science

Hierarchical Embedding Fusion for Retrieval-Augmented Code Generation

この論文は、リポジトリ全体の情報を高密度な階層的ベクトルに圧縮し、擬似トークンとして生成モデルに効率的に統合する「階層的埋め込み融合（HEF）」手法を提案し、既存の検索拡張コード生成手法と同等の精度を維持しつつ、単一 GPU 上でサブ秒の低遅延を実現することを示しています。

Nikita Sorokin, Ivan Sedykh, Valentin Malykh2026-03-10🤖 cs.LG

FuzzingRL: Reinforcement Fuzz-Testing for Revealing VLM Failures

この論文は、視覚・言語のファジングと敵対的強化学習微調整を組み合わせることで、VLM の脆弱性を意図的に誘発し、その回答精度を大幅に低下させる質問を自動生成する「FuzzingRL」という手法を提案しています。

Jiajun Xu, Jiageng Mao, Ang Qi, Weiduo Yuan, Alexander Romanus, Helen Xia, Vitor Campagnolo Guizilini, Yue Wang2026-03-10🤖 cs.LG

Switchable Activation Networks

この論文は、各ニューロンに入力依存のバイナリゲートを導入して計算を動的に制御し、推論効率の向上とモデルの圧縮を両立させる新しいフレームワーク「SWAN（Switchable Activation Networks）」を提案しています。

Laha Ale, Ning Zhang, Scott A. King, Pingzhi Fan2026-03-10🤖 cs.LG

Khatri-Rao Clustering for Data Summarization

この論文は、大規模で複雑なデータセットの要約において、従来の重心ベースのクラスタリングが抱える冗長性の課題を克服し、より簡潔かつ正確な要約を実現するための「Khatri-Rao クラスタリング」パラダイムを提案し、k-Means および深層クラスタリングへの適用を通じてその有効性を示しています。

Martino Ciaperoni, Collin Leiber, Aristides Gionis, Heikki Mannila2026-03-10🤖 cs.LG

Scale Dependent Data Duplication

本論文は、モデルの能力向上に伴い意味的な重複データが厳密な重複と同様の悪影響を及ぼす「スケール依存性のデータ重複」を明らかにし、その影響を定量化するスケーリング則を導出することで、大規模モデルの性能予測精度を向上させることを示しています。

Joshua Kazdan, Noam Levi, Rylan Schaeffer, Jessica Chudnovsky, Abhay Puri, Bo He, Mehmet Donmez, Sanmi Koyejo, David Donoho2026-03-10🤖 cs.LG

Know When You're Wrong: Aligning Confidence with Correctness for LLM Error Detection

この論文は、出力アンカートークンの確率に基づく正規化された信頼度スコアと自己評価フレームワークを提案し、LLM の誤り検出を可能にするだけでなく、強化学習による過信を抑制して信頼性を回復させる手法を明らかにしたものです。

Xie Xiaohu, Liu Xiaohu, Yao Benjamin2026-03-10🤖 cs.LG

Structure-Aware Set Transformers: Temporal and Variable-Type Attention Biases for Asynchronous Clinical Time Series

この論文は、非同期な臨床時系列データにおける時間的局所性と変数間の親和性を学習可能なアテンションバイアスとして組み込むことで、グリッド化やポイントセットの両方の欠点を克服し、ICU 予測タスクで最先端の性能を達成する「構造認識型セットトランスフォーマー（STAR）」を提案しています。

Joohyung Lee, Kwanhyung Lee, Changhun Kim, Eunho Yang2026-03-10🤖 cs.LG

LegoNet: Memory Footprint Reduction Through Block Weight Clustering

この論文は、モデルの再学習やアーキテクチャ変更を一切行わずに、重みをブロック単位でクラスタリングする「LegoNet」という圧縮手法を提案し、ResNet-50 において 64 倍のメモリ削減と精度維持、あるいは 128 倍の削減で 3% 未満の精度低下を実現することを示しています。

Joseph Bingham, Noah Green, Saman Zonouz2026-03-10🤖 cs.LG

Multi-Agent DRL for V2X Resource Allocation: Disentangling Challenges and Benchmarking Solutions

本論文は、C-V2X ネットワークにおけるマルチエージェント深層強化学習の課題を特定し、その影響を分離評価するためのベンチマーク環境と大規模データセットを構築して公開し、特に多様な交通環境へのゼロショット転送能力の重要性を明らかにした。

Siyuan Wang, Lei Lei, Pranav Maheshwari, Sam Bellefeuille, Kan Zheng, Dusit Niyato2026-03-10🤖 cs.LG

Scaling Strategy, Not Compute: A Stand-Alone, Open-Source StarCraft II Benchmark for Accessible Reinforcement Learning Research

この論文は、スタークラフト II のフルゲームとミニゲームの中間に位置し、経済メカニズムを排除して長距離移動と戦闘の戦術的スキルに焦点を当てた、計算コストを抑えたオープンソースの新しい RL ベンチマーク「Two-Bridge Map Suite」を提案するものである。

Sourav Panda, Shreyash Kale, Tanmay Ambadkar, Abhinav Verma, Jonathan Dodge2026-03-10🤖 cs.LG

Valid Feature-Level Inference for Tabular Foundation Models via the Conditional Randomization Test

本論文は、TabPFN と条件付ランダム化検定（CRT）を組み合わせることで、モデルの再学習やパラメトリックな仮定を必要とせず、非線形かつ相関のある設定においても有限サンプルで有効な特徴量レベルの仮説検定と p 値を提供する手法を提案しています。

Mohamed Salem2026-03-10🤖 cs.LG

CapTrack: Multifaceted Evaluation of Forgetting in LLM Post-Training

本論文では、LLM のファインチューニングによる「忘却」を単なる知識の喪失ではなく行動やユーザー体験の劣化として再定義し、この多面的な評価を行うためのフレームワーク「CapTrack」を提案するとともに、大規模な実証研究を通じて忘却がロバスト性やデフォルト行動にも及ぶこと、および指示微調整が最も大きなドリフトを引き起こす一方で、好適化はより保守的で一部能力の回復に寄与することを明らかにしています。

Lukas Thede, Stefan Winzeck, Zeynep Akata, Jonathan Richard Schwarz2026-03-10🤖 cs.LG

A Novel Approach for Testing Water Safety Using Deep Learning Inference of Microscopic Images of Unincubated Water Samples

この論文は、培養を不要とし、深層学習と画像拡張技術を用いて数秒で水質安全性を判定する低コストなシステム「DeepScope」を開発し、実地試験で高い精度を達成したことを報告しています。

Sanjay Srinivasan2026-03-10🤖 cs.LG

Consensus is Not Verification: Why Crowd Wisdom Strategies Fail for LLM Truthfulness

外部検証が不可能な領域において、複数のモデルからの回答を集約する「群衆の知恵」戦略は、誤答の相関性や自信スコアの信頼性不足により、推論コストを増大させても真実性の向上につながらず、むしろ共通の誤解を強化するだけであり、検証可能な領域とは異なる推論時スケーリングの限界を示している。

Yegor Denisov-Blanch, Joshua Kazdan, Jessica Chudnovsky, Rylan Schaeffer, Sheng Guan, Soji Adeshina, Sanmi Koyejo2026-03-10🤖 cs.LG

OptiRoulette Optimizer: A New Stochastic Meta-Optimizer for up to 5.3x Faster Convergence

本論文は、トレーニング中に最適化手法を動的に選択する新しい確率的メタ最適化手法「OptiRoulette」を提案し、複数の画像分類タスクにおいて単一の AdamW ベースラインと比較して最大 5.3 倍の収束速度向上と高精度達成を実現したことを報告しています。

Stamatis Mastromichalakis2026-03-10🤖 cs.LG

Correlation Analysis of Generative Models

この論文は、拡散モデルとフローマッチングを統一的な線形方程式で表現し、既存モデルにおけるノイズデータと予測ターゲット間の相関が弱いことが学習プロセスに悪影響を及ぼす可能性を理論的に示しています。

Zhengguo Li, Chaobing Zheng, Wei Wang2026-03-10🤖 cs.LG

Annealed Co-Generation: Disentangling Variables via Progressive Pairwise Modeling

この論文は、高次元拡散モデルの代わりに低次元拡散モデルを組み合わせる「Annealed Co-Generation（ACG）」フレームワークを提案し、因果変数をペアごとに学習して共有変数を介して結合する三段階のアニーリングプロセスにより、科学的タスクにおける多変量共生成の計算負荷とデータ不均衡を解決し、一貫性のある生成を実現することを示しています。

Hantao Zhang, Jieke Wu, Mingda Xu, Xiao Hu, Yingxuan You, Pascal Fua2026-03-10🤖 cs.LG

RACER: Risk-Aware Calibrated Efficient Routing for Large Language Models

この論文は、マルチモデルシステムにおけるコストと性能のトレードオフを最適化するため、誤分類リスクを厳密に制御しつつ最適な大規模言語モデルの集合を動的に選択する新しい手法「RACER」を提案し、その理論的保証と高い精度を実証しています。

Sai Hao, Hao Zeng, Hongxin Wei, Bingyi Jing2026-03-10🤖 cs.LG

Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance

この論文は、自己回帰モデルと拡散モデルを連続的な潜在軌道として統合し、生成の確信度に応じて両者のバランスを動的に調整することで、推論速度を維持しつつ高い生成品質と推論能力を実現する新しい大規模言語モデル「Evo」を提案しています。

Junde Wu, Minhao Hu, Jiayuan Zhu, Yuyuan Liu, Tianyi Zhang, Kang Li, Jingkun Chen, Jiazhen Pan, Min Xu, Yueming Jin2026-03-10🤖 cs.LG

Distilling and Adapting: A Topology-Aware Framework for Zero-Shot Interaction Prediction in Multiplex Biological Networks

この論文は、ドメイン固有の基盤モデル、トポロジー意識型グラフトークナイザー、教師-生徒型知識蒸留を組み合わせることで、未見のエンティティに対するゼロショット相互作用予測を可能にする新しいマルチプレックス生物ネットワーク用フレームワークを提案し、最先端の手法を上回る性能を実証したものである。

Alana Deng, Sugitha Janarthanan, Yan Sun, Zihao Jing, Pingzhao Hu2026-03-10🤖 cs.LG

← 前へ次へ →