A Quantitative Characterization of Forgetting in Post-Training

この論文は、二成分混合モデルを用いた理論的枠組みを構築し、KL 発散の方向性、幾何学的な行動の重なり、サンプリング戦略、および過去の行動の可視性が、生成モデルの継続的学習における「質量の消失」と「成分のドリフト」という 2 種類の忘却をどのように定量的に決定するかを明らかにしています。

Krishnakumar Balasubramanian, Shiva Prasad Kasiviswanathan2026-03-13📊 stat

Strategic Navigation or Stochastic Search? How Agents and Humans Reason Over Document Collections

本論文は、文書コレクションを扱うマルチモーダルエージェントが真の戦略的思考を持っているのか、それとも単なる試行錯誤に依存しているのかを検証するため、人間が作成した質問と多様な PDF ドキュメントからなる新しいベンチマーク「MADQA」を提案し、最善のエージェントが人間と同等の精度を達成しても、戦略的欠如により非生産的なループに陥り、オラクル性能との間に約 20% の格差が残っていることを明らかにしています。

Łukasz Borchmann, Jordy Van Landeghem, Michał Turski, Shreyansh Padarha, Ryan Othniel Kearns, Adam Mahdi, Niels Rogge, Clémentine Fourrier, Siwei Han, Huaxiu Yao, Artemis Llabrés, Yiming Xu, Dimosthenis Karatzas, Hao Zhang, Anupam Datta2026-03-13💬 cs.CL

Proof-Carrying Materials: Falsifiable Safety Certificates for Machine-Learned Interatomic Potentials

本論文は、単一の機械学習原子間ポテンシャルの信頼性不足を克服し、敵対的検証、ブートストラップ推定、Lean 4 による形式的証明の 3 段階プロセス「Proof-Carrying Materials」を導入することで、安定材料の発見率を 25% 向上させ、計算材料科学における安全性保証を実現する手法を提案しています。

Abhinaba Basu, Pavan Chakraborty2026-03-13🔬 cond-mat.mtrl-sci

Compiling Temporal Numeric Planning into Discrete PDDL+: Extended Version

この論文は、自己重なりを仮定しない条件下で、時間的数値計画(PDDL 2.1 の継続的アクションを含む)を PDDL+ に多項式時間で変換する実用的なコンパイル手法を提案し、その計画長が一定倍率で保たれることと、困難な時間的数値問題に対する実用性を実験的に示したものである。

Andrea Micheli, Enrico Scala, Alessandro Valentini2026-03-13🤖 cs.AI

RDNet: Region Proportion-Aware Dynamic Adaptive Salient Object Detection Network in Optical Remote Sensing Images

この論文は、光学リモートセンシング画像におけるスケーラ変動への頑健性と正確な物体局在化を実現するため、SwinTransformer を基盤とし、領域比率を考慮した動的適応詳細認識モジュール、周波数整合コンテキスト強化モジュール、および領域比率感知局在化モジュールを統合した「RDNet」を提案するものである。

Bin Wan, Runmin Cong, Xiaofei Zhou, Hao Fang, Yaoqi Sun, Sam Kwong2026-03-13🤖 cs.AI

Portfolio of Solving Strategies in CEGAR-based Object Packing and Scheduling for Sequential 3D Printing

本論文は、現代のマルチコア CPU の並列処理能力を活用し、複数の配置戦略をポートフォリオとして並列実行する「Portfolio-CEGAR-SEQ」という手法を提案することで、逐次 3D プリントにおける物体配置とスケジューリングの複雑な組み合わせ問題を効率的に解決し、従来の CEGAR-SEQ アルゴリズムよりも少ない印刷プレート数でバッチ処理を実現できることを示しています。

Pavel Surynek2026-03-13🤖 cs.AI

Sparking Scientific Creativity via LLM-Driven Interdisciplinary Inspiration

この論文は、特定の解決策に过早に依存せず、抽象的な研究目標をドメインに依存しない概念的問題に変換して他分野から洞察を統合・再文脈化する「Idea-Catalyst」というフレームワークを提案し、これにより科学的研究の新奇性と洞察性を大幅に向上させることを示しています。

Priyanka Kargupta, Shuhaib Mehri, Dilek Hakkani-Tur, Jiawei Han2026-03-13💬 cs.CL

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

この論文は、大規模な事前学習モデルの重みの周辺には多様なタスク特化型解が高密度に存在することを示し、勾配降下法に頼らずランダムな摂動のサンプリングと多数決によるアンサンブルという単純な手法でも、PPO や GRPO などの標準的な後学習法と同等の性能を達成できることを明らかにしています。

Yulu Gan, Phillip Isola2026-03-13🤖 cs.LG

Separable neural architectures as a primitive for unified predictive and generative intelligence

この論文は、高次元なマッピングを低次数の成分に分解する構造的帰納バイアスを導入した「分離可能ニューラルアーキテクチャ(SNA)」を提案し、物理的・言語的・知覚的システムにおける因子分解構造を明示的に活用することで、決定論的および分布論的表現を統合する汎用的な知能のプリミティブを実現したことを示しています。

Reza T. Batley, Apurba Sarker, Rajib Mostakim, Andrew Klichine, Sourav Saha2026-03-13🤖 cs.LG

Examining Reasoning LLMs-as-Judges in Non-Verifiable LLM Post-Training

この論文は、非検証可能なドメインにおける LLM 後学習において、推論能力を持つ「推論型ジャッジ」が報酬ハッキングを抑制しゴールドスタンダードな評価基準で高い性能を発揮する一方で、その高性能が他の LLM ジャッジを欺く高度な敵対的出力の生成によるものであるという、重要な発見と改善の余地を示す研究です。

Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen2026-03-13🤖 cs.AI

SciMDR: Benchmarking and Advancing Scientific Multimodal Document Reasoning

この論文は、科学的マルチモーダル文書推論のスケール、忠実度、現実性のトレードオフを解決する「合成・再埋め込み」フレームワークを提案し、これを用いて大規模な学習データセット SciMDR と評価ベンチマーク SciMDR-Eval を構築し、複雑な文書レベルの推論を要するタスクにおいてモデルの性能を大幅に向上させることを示しています。

Ziyu Chen, Yilun Zhao, Chengye Wang, Rilyn Han, Manasi Patwardhan, Arman Cohan2026-03-13💬 cs.CL

Explainability of Text Processing and Retrieval Methods: A Survey

この論文は、深層学習や機械学習に基づく自然言語処理および情報検索モデルの非線形構造による解釈の難しさを克服し、単語埋め込みからトランスフォーマー、文書ランキングに至るまでの主要な手法の解釈可能性と説明可能性に関する研究を包括的に調査し、今後の研究の方向性を示唆するものである。

Sourav Saha, Debapriyo Majumdar, Mandar Mitra2026-03-12💬 cs.CL

An Updated Assessment of Reinforcement Learning for Macro Placement

この論文は、Google Brain の深層強化学習を用いたマクロ配置手法(Circuit Training)について、より強力なシミュレーテッド・アニーリング手法や商用ツールを用いた真の報酬評価、および新しいナノメートル級ベンチマークを通じて再評価を行い、再現性やスケーラビリティに関する未解決の課題を浮き彫りにしています。

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Mindstorms in Natural Language-Based Societies of Mind

本論文は、大規模言語モデルや他のニューラルネットワークを自然言語で対話させる「マインドストーム」を通じて単一モデルの限界を克服する「自然言語ベースの社会の心(NLSOM)」の概念を提唱し、その実証実験と、将来的な大規模異種エージェント社会の構造や経済原理に関する新たな研究課題を議論しています。

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL