cs.LG 件の論文 | Gist.Science

Strictly Constrained Generative Modeling via Split Augmented Langevin Sampling

この論文は、ラグランジュ双対性と変数分割を活用した新しいプリマル・デュアルサンプリングアルゴリズム「CASAL」を提案し、生成モデルが物理的制約を厳密に満たしながら複雑な物理システムや最適制御問題に適用可能であることを理論的・実証的に示しています。

Matthieu Blanke, Yongquan Qu, Sara Shamekh, Pierre Gentine2026-03-13🤖 cs.LG

Your Classifier Can Do More: Towards Balancing the Gaps in Classification, Robustness, and Generation

この論文は、分類、頑健性、生成能力の三つの性能を同時に達成する新たな枠組み「EB-JDAT」を提案し、エネルギー分布の整合化を通じて既存のトレードオフを打破する手法を提示しています。

Kaichao Jiang, He Wang, Xiaoshuai Hao, Xiulong Yang, Ajian Liu, Qi Chu, Yunfeng Diao, Richang Hong2026-03-13🤖 cs.LG

Enhancing Sample Efficiency in Multi-Agent RL with Uncertainty Quantification and Selective Exploration

この論文は、アンサンブルの尖度を利用した選択的探索、分散型アンサンブル学習を組み合わせた分解型中央クリティック、および混合サンプルに基づくアクタ更新を導入することで、マルチエージェント強化学習のサンプル効率と安定性を大幅に向上させる新しいアルゴリズムを提案し、SMAC II などを含むベンチマークで最先端の手法を上回る性能を実証しています。

Tom Danino, Nahum Shimkin2026-03-13⚡ eess

Refine-POI: Reinforcement Fine-Tuned Large Language Models for Next Point-of-Interest Recommendation

本論文は、大規模言語モデルを用いた次なる関心地点（POI）推薦において、トポロジーを考慮した意味的 ID 生成と強化学微細調整（Reinforcement Fine-Tuning）を導入し、既存手法が抱える意味的連続性の欠如やトップ 1 予測への依存という課題を克服し、高精度かつ説明可能なトップ k 推薦リストの生成を実現する「Refine-POI」というフレームワークを提案しています。

Peibo Li, Shuang Ao, Hao Xue, Yang Song, Maarten de Rijke, Johan Barthélemy, Tomasz Bednarz, Flora D. Salim2026-03-13🤖 cs.LG

NeuralOS: Towards Simulating Operating Systems via Neural Generative Models

本論文は、ユーザー入力を直接画面フレームに変換する再帰型ニューラルネットワークと拡散ベースのレンダラーを組み合わせ、実際の操作記録や AI エージェントによる合成データから学習することで、既存の OS の GUI 再現だけでなく、インストールされていないアプリケーション（例：Doom）の動作さえもシミュレート可能なニューラル OS「NeuralOS」を提案するものである。

Luke Rivard, Sun Sun, Hongyu Guo, Wenhu Chen, Yuntian Deng2026-03-13💬 cs.CL

Seq vs Seq: An Open Suite of Paired Encoders and Decoders

この論文は、パラメータ数や学習データが同一の条件でトレーニングされたエンコーダ型とデコーダ型のモデルのペア「Ettin」を公開し、それぞれのタスク（分類・検索対生成）において専用モデルが他方への転用学習よりも優れていることを実証するとともに、すべての学習アーティファクトをオープンソース化しています。

Orion Weller, Kathryn Ricci, Marc Marone, Antoine Chaffin, Dawn Lawrie, Benjamin Van Durme2026-03-13💬 cs.CL

Efficient Compositional Multi-tasking for On-device Large Language Models

この論文は、リソース制約のあるオンデバイス環境において、翻訳と要約などの複数のタスクを同時に実行する「構成的マルチタスク」を可能にするためのベンチマークと、学習可能な較正（Learnable Calibration）と呼ばれる効率的な手法を提案するものである。

Ondrej Bohdal, Mete Ozay, Jijoong Moon, Kyeng-Hun Lee, Hyeonmok Ko, Umberto Michieli2026-03-13💬 cs.CL

Agentic Design Review System

本論文は、複数のエージェントがメタエージェントによって調整され、グラフマッチングに基づく例選択やプロンプト拡張技術を活用してグラフィックデザインを多角的に評価し、実用的なフィードバックを生成する「Agentic Design Review System（AgenticDRS）」と、その性能を検証するための新たなベンチマーク「DRS-BENCH」を提案するものである。

Sayan Nag, K J Joseph, Koustava Goswami, Vlad I Morariu, Balaji Vasan Srinivasan2026-03-13🤖 cs.AI

On the Theoretical Limitations of Embedding-Based Retrieval

本論文は、埋め込み次元によって表現可能な上位 k 個の文書集合の数が理論的に制限されることを示し、単純なクエリであっても最先端のモデルがこの制約により失敗することを実証することで、単一ベクトルパラダイムの根本的な限界を明らかにしている。

Orion Weller, Michael Boratko, Iftekhar Naim, Jinhyuk Lee2026-03-13💬 cs.CL

Disentangling Slow and Fast Temporal Dynamics in Degradation Inference with Hierarchical Differential Models

本論文は、機械およびインフラシステムの劣化推論において、操作変動と劣化ダイナミクスを効果的に分離し、数値的効率と推論精度を向上させる階層制御微分方程式（H-CDE）フレームワークを提案しています。

Mengjie Zhao, Olga Fink2026-03-13🤖 cs.LG

Distribution estimation via Flow Matching with Lipschitz guarantees

この論文は、フローマッチングのベクトル場に対するリプシッツ定数の依存性を制御する仮定を明らかにし、対数凹性を必要としない高次元の非有界分布に対しても、従来の結果を改善する Wasserstein 距離における収束率を導出するものです。

Lea Kunkel2026-03-13📊 stat

Text-Trained LLMs Can Zero-Shot Extrapolate PDE Dynamics, Revealing a Three-Stage In-Context Learning Mechanism

本論文は、微調整や自然言語プロンプトなしで、テキスト学習済みの大規模言語モデル（LLM）が離散化された偏微分方程式（PDE）の解から時空ダイナミクスをゼロショットで外挿できることを示し、その精度が文脈長と出力長に依存するスケーリング則に従うとともに、トークンレベルの出力分布分析から「構文模倣」「高エントロピー探索」「数値的根拠に基づく予測」という 3 段階の文脈内学習メカニズムを明らかにしたものである。

Jiajun Bao, Nicolas Boullé, Toni J. B. Liu, Raphaël Sarfati, Christopher J. Earls2026-03-13🤖 cs.LG

Ultra-Fast Language Generation via Discrete Diffusion Divergence Instruct

本論文は、積分 KL 発散最小化に基づく理論的枠組みと、報酬正規化や中間状態マッチングなどの技術を採用した「DiDi-Instruct」という手法を提案し、事前学習済み離散拡散言語モデルから高速かつ高品質な生成が可能な少数ステップの学生モデルを効率的に蒸留する新たなアプローチを示しています。

Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, Nan Jiang, Zheyuan Hu, Weijian Luo, Wei Deng, Guang Lin2026-03-13💬 cs.CL

Contrastive Diffusion Guidance for Spatial Inverse Problems

この論文は、非微分可能かつ部分的にしか指定されていない前方演算子を持つ逆問題（例えば歩行軌道からの間取り復元）において、従来の勾配に基づくガイダンスが不安定になる課題を解決するため、対照学習で学習した埋め込み空間内で疑似尤度スコアを計算し、拡散モデルの事後分布サンプリングを安定化させる「CoGuide」という手法を提案しています。

Sattwik Basu, Chaitanya Amballa, Zhongweiyang Xu, Jorge Vančo Sampedro, Srihari Nelakuditi, Romit Roy Choudhury2026-03-13⚡ eess

Busemann Functions in the Wasserstein Space: Existence, Closed-Forms, and Applications to Slicing

本論文は、最適輸送によって誘起されるリーマン幾何構造を持つワッサーシュタイン空間におけるブセマン関数の存在と計算可能性を研究し、1 次元分布およびガウス測度に対する閉形式解を導出することで、確率分布の射影やガウス混合モデル・ラベル付きデータセットにおける新しいスライス・ワッサーシュタイン距離の定義、ならびにその転移学習などへの応用を可能にした。

Clément Bonet, Elsa Cazelles, Lucas Drumetz, Nicolas Courty2026-03-13📊 stat

Refereed Learning

この論文は、2 人の競合する証明者（1 人は誠実）からなる「審査付き学習」の枠組みを提唱し、特に高精度なモデル選択タスクにおいて、従来の単一証明者や証明者なしの手法を大幅に凌駕する効率性と精度を達成するプロトコルを構築し、その最適性を示す下限を証明したものである。

Ran Canetti, Ephraim Linder, Connor Wagaman2026-03-13📊 stat

UniFField: A Generalizable Unified Neural Feature Field for Visual, Semantic, and Spatial Uncertainties in Any Scene

この論文は、視覚・意味・幾何学的特徴を統合し、各モダリティの不確実性を推定することで、任意の環境にゼロショットで適用可能な汎用的なニューラル特徴フィールド「UniFField」を提案し、ロボットの頑健な意思決定を可能にする手法を提示しています。

Christian Maurer, Snehal Jauhri, Sophie Lueth, Georgia Chalvatzaki2026-03-13🤖 cs.LG

Counterfactually Fair Conformal Prediction

この論文は、不確実性下での公平な意思決定を可能にするため、対称化手法を用いて保護属性への介入を考慮した予測集合を生成し、反事実的公平性と marginal 被覆性を両立させる「反事実的公平な適合予測（CF-CP）」という新しい枠組みを提案し、その有効性を理論的および実証的に示しています。

Ozgur Guldogan, Neeraj Sarna, Yuanyuan Li, Michael Berger2026-03-13🤖 cs.LG

CodeEvolve: an open source evolutionary coding agent for algorithmic discovery and optimization

LLM と進化アルゴリズムを組み合わせるオープンソースフレームワーク「CodeEvolve」は、計算コストを大幅に削減しつつ、AlphaEvolve などの既存手法を凌駕する最先端のアルゴリズム発見能力を実現します。

Henrique Assumpção, Diego Ferreira, Leandro Campos, Fabricio Murai2026-03-13🤖 cs.AI

A Foundational Theory of Quantitative Abstraction: Adjunctions, Duality, and Logic for Probabilistic Systems

この論文は、圏論、石炭代数、量的論理、および最適輸送を統合し、確率システムの振る舞い的擬距離の $\varepsilon$ -商を普遍性を持つ標準的な抽象化として確立することで、確率領域における量的状態抽象化と表現学習の厳密な理論的基盤を提供するものである。

Nivar Anwer (Georgia Institute of Technology, USA), Ezequiel López-Rubio (University of Málaga, Spain,IBIMA Plataforma BIONAND, Spain), David Elizondo (De Montfort University, United Kingdom), Rafael M. Luque-Baena (University of Málaga, Spain,IBIMA Plataforma BIONAND, Spain)2026-03-13🤖 cs.LG

← 前へ次へ →