Text-Trained LLMs Can Zero-Shot Extrapolate PDE Dynamics, Revealing a Three-Stage In-Context Learning Mechanism

本論文は、微調整や自然言語プロンプトなしで、テキスト学習済みの大規模言語モデル(LLM)が離散化された偏微分方程式(PDE)の解から時空ダイナミクスをゼロショットで外挿できることを示し、その精度が文脈長と出力長に依存するスケーリング則に従うとともに、トークンレベルの出力分布分析から「構文模倣」「高エントロピー探索」「数値的根拠に基づく予測」という 3 段階の文脈内学習メカニズムを明らかにしたものである。

Jiajun Bao, Nicolas Boullé, Toni J. B. Liu, Raphaël Sarfati, Christopher J. Earls2026-03-13🤖 cs.LG

Ultra-Fast Language Generation via Discrete Diffusion Divergence Instruct

本論文は、積分 KL 発散最小化に基づく理論的枠組みと、報酬正規化や中間状態マッチングなどの技術を採用した「DiDi-Instruct」という手法を提案し、事前学習済み離散拡散言語モデルから高速かつ高品質な生成が可能な少数ステップの学生モデルを効率的に蒸留する新たなアプローチを示しています。

Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, Nan Jiang, Zheyuan Hu, Weijian Luo, Wei Deng, Guang Lin2026-03-13💬 cs.CL

Contrastive Diffusion Guidance for Spatial Inverse Problems

この論文は、非微分可能かつ部分的にしか指定されていない前方演算子を持つ逆問題(例えば歩行軌道からの間取り復元)において、従来の勾配に基づくガイダンスが不安定になる課題を解決するため、対照学習で学習した埋め込み空間内で疑似尤度スコアを計算し、拡散モデルの事後分布サンプリングを安定化させる「CoGuide」という手法を提案しています。

Sattwik Basu, Chaitanya Amballa, Zhongweiyang Xu, Jorge Vančo Sampedro, Srihari Nelakuditi, Romit Roy Choudhury2026-03-13⚡ eess

Busemann Functions in the Wasserstein Space: Existence, Closed-Forms, and Applications to Slicing

本論文は、最適輸送によって誘起されるリーマン幾何構造を持つワッサーシュタイン空間におけるブセマン関数の存在と計算可能性を研究し、1 次元分布およびガウス測度に対する閉形式解を導出することで、確率分布の射影やガウス混合モデル・ラベル付きデータセットにおける新しいスライス・ワッサーシュタイン距離の定義、ならびにその転移学習などへの応用を可能にした。

Clément Bonet, Elsa Cazelles, Lucas Drumetz, Nicolas Courty2026-03-13📊 stat

UniFField: A Generalizable Unified Neural Feature Field for Visual, Semantic, and Spatial Uncertainties in Any Scene

この論文は、視覚・意味・幾何学的特徴を統合し、各モダリティの不確実性を推定することで、任意の環境にゼロショットで適用可能な汎用的なニューラル特徴フィールド「UniFField」を提案し、ロボットの頑健な意思決定を可能にする手法を提示しています。

Christian Maurer, Snehal Jauhri, Sophie Lueth, Georgia Chalvatzaki2026-03-13🤖 cs.LG

Counterfactually Fair Conformal Prediction

この論文は、不確実性下での公平な意思決定を可能にするため、対称化手法を用いて保護属性への介入を考慮した予測集合を生成し、反事実的公平性と marginal 被覆性を両立させる「反事実的公平な適合予測(CF-CP)」という新しい枠組みを提案し、その有効性を理論的および実証的に示しています。

Ozgur Guldogan, Neeraj Sarna, Yuanyuan Li, Michael Berger2026-03-13🤖 cs.LG

A Foundational Theory of Quantitative Abstraction: Adjunctions, Duality, and Logic for Probabilistic Systems

この論文は、圏論、石炭代数、量的論理、および最適輸送を統合し、確率システムの振る舞い的擬距離のε\varepsilon-商を普遍性を持つ標準的な抽象化として確立することで、確率領域における量的状態抽象化と表現学習の厳密な理論的基盤を提供するものである。

Nivar Anwer (Georgia Institute of Technology, USA), Ezequiel López-Rubio (University of Málaga, Spain,IBIMA Plataforma BIONAND, Spain), David Elizondo (De Montfort University, United Kingdom), Rafael M. Luque-Baena (University of Málaga, Spain,IBIMA Plataforma BIONAND, Spain)2026-03-13🤖 cs.LG

Belief Dynamics Reveal the Dual Nature of In-Context Learning and Activation Steering

この論文は、ベイズ的観点からプロンプトによる文脈内学習と内部活性化の操作という一見異なる LLM 制御手法を、それぞれ「証拠の蓄積」と「概念の事前確率の変更」として統一的に説明する予測モデルを提案し、両者の相加性や急激な行動変化など新たな現象を予測可能にしました。

Eric Bigelow, Daniel Wurgaft, YingQiao Wang, Noah Goodman, Tomer Ullman, Hidenori Tanaka, Ekdeep Singh Lubana2026-03-13📊 stat

Precision-Scalable Microscaling Datapaths with Optimized Reduction Tree for Efficient NPU Integration

本論文は、継続学習向けに推論と学習の両方を効率的に支援するため、マイクロスケーリング(MX)形式の乗算累積演算において既存の設計が抱える精度と効率のトレードオフを解決するハイブリッドな精度スケーラブルな削減木を提案し、SNAX プラットフォームへの統合を通じて MXINT8、MXFP8/6、MXFP4 各形式で高エネルギー効率と高スループットを実現したことを報告するものである。

Stef Cuyckens, Xiaoling Yi, Robin Geens + 4 more2026-03-13⚡ eess

RefTr: Recurrent Refinement of Confluent Trajectories for 3D Vascular Tree Centerlines

本論文は、トランスフォーマーベースの Producer-Refiner 構造と共収束軌道の反復的洗練を採用し、3D 血管中心線の抽出においてトポロジの正確性と精度を向上させつつ、既存の最先端手法に比べて推論を高速化しパラメータ数を大幅に削減する「RefTr」というフレームワークを提案しています。

Roman Naeem, David Hagerman, Jennifer Alvén, Fredrik Kahl2026-03-13🤖 cs.LG

Cross-Space Synergy: A Unified Framework for Multimodal Emotion Recognition in Conversation

本論文は、低ランクテンソル分解に基づく高次クロスモーダル相互作用の効率的な捉え方と、競合する目的関数間の勾配競合を緩和するパレート最適方向への更新制御を組み合わせることで、対話におけるマルチモーダル感情認識の精度と訓練の安定性を向上させる「Cross-Space Synergy(CSS)」という統合フレームワークを提案し、IEMOCAP および MELD データセットにおいて既存手法を上回る性能を実証したものである。

Xiaosen Lyu, Jiayu Xiong, Yuren Chen + 3 more2026-03-13🤖 cs.LG

Domain Feature Collapse: Implications for Out-of-Distribution Detection and Solutions

この論文は、単一ドメインデータでの教師あり学習が情報ボトルネック最適化によりドメイン特徴の崩壊を引き起こし、分布外検出を破綻させるという理論的メカニズムを情報理論的に解明し、事前学習表現を用いたドメインフィルタリングによる解決策を提案するものです。

Hong Yang, Devroop Kar, Qi Yu, Alex Ororbia, Travis Desell2026-03-13🤖 cs.LG

Forests of Uncertaint(r)ees: Using tree-based ensembles to estimate probability distributions of future conflict

本論文は、樹木ベースのアンサンブル学習と分布回帰を組み合わせたカスタム AutoML 手法を開発し、暴力紛争の将来発生確率分布を推定することで、従来の点予測の限界を克服し、PRIO-GRID 月次レベルでの 1 年先までの予測精度を向上させることを示しています。

Daniel Mittermaier, Tobias Bohne, Martin Hofer, Daniel Racek2026-03-13📊 stat

Entropic Confinement and Mode Connectivity in Overparameterized Neural Networks

この論文は、過剰パラメータ化されたニューラルネットワークにおいて、損失が平坦な経路が存在するにもかかわらず最適化が単一の盆地に閉じ込められるというパラドックスを、曲率の変動と最適化ノイズの相互作用によって生じるエントロピー障壁(曲率誘起のエントロピー力)によって説明し、これが解の局在化を支配していることを明らかにしています。

Luca Di Carlo, Chase Goddard, David J. Schwab2026-03-13📊 stat