cs.LG 件の論文 | Gist.Science

OpenSanctions Pairs: Large-Scale Entity Matching with LLMs

この論文は、実世界の国際制裁データから構築された大規模なエンティティマッチングベンチマーク「OpenSanctions Pairs」を公開し、既存のルールベース手法を大幅に上回る精度で LLM が機能することを実証するとともに、今後の研究の焦点をペアマッチングからブロッキングやクラスタリングなどのパイプライン構成要素へシフトさせる必要性を提言しています。

Chandler Smith, Magnus Sesodia, Friedrich Lindenberg, Christian Schroeder de Witt2026-03-13💬 cs.CL

Structure-Aware Epistemic Uncertainty Quantification for Neural Operator PDE Surrogates

本論文は、ニューラルオペレータのモジュール構造（リフティング・伝播・復元）を活用し、リフティング段階にのみ確率的摂動を注入することで、計算効率と空間的忠実性を両立した構造化エピステミック不確実性推定手法を提案し、複雑な偏微分方程式の surrogate モデルにおける信頼性の高い不確実性評価を実現することを示しています。

Haoze Song, Zhihao Li, Mengyi Deng, Xin Li, Duyi Pan, Zhilu Lai, Wei Wang2026-03-13🤖 cs.LG

Speculative Decoding Scaling Laws (SDSL): Throughput Optimization Made Simple

この論文は、推論スループットの最適化を従来の実験的アプローチに頼らず、事前学習済み大規模言語モデルのハイパーパラメータと推論効率を理論的に結びつけることで、推論システムの構成要素を事前学習前に最適化可能にする「Speculative Decoding Scaling Laws (SDSL)」を提案しています。

Amirhossein Bozorgkhoo, Igor Molybog2026-03-13💬 cs.CL

TinyNav: End-to-End TinyML for Real-Time Autonomous Navigation on Microcontrollers

本論文は、ESP32 マイコン上で 30ms の推論遅延を実現し、外部計算リソースに依存せずリアルタイム自律航行を可能にする、2 万 3 千パラメータの量子化 2D CNN を用いたエンドツーエンドの TinyML システム「TinyNav」を提案するものである。

Pooria Roy, Nourhan Jadallah. Tomer Lapid, Shahzaib Ahmad, Armita Afroushe, Mete Bayrak2026-03-13🤖 cs.LG

Interventional Time Series Priors for Causal Foundation Models

本論文は、時間系列の因果推論における基礎モデルの構築を可能にするため、介入データを含む合成時系列構造因果モデルを生成するフレームワーク「CausalTimePrior」を提案し、これにより事前適合ネットワーク（PFN）が未知のモデルに対して文脈内因果効果推論を遂行できることを実証しています。

Dennis Thumm, Ying Chen2026-03-13🤖 cs.LG

Fingerprinting Concepts in Data Streams with Supervised and Unsupervised Meta-Information

この論文は、データストリームにおける概念ドリフトの検出精度を向上させるため、多数のメタ情報特徴量からなる一意な「指紋」を動的に重み付けして概念を表現する汎用フレームワーク「FiCSUM」を提案し、実世界および合成データセットにおける既存手法を上回る性能を実証したものである。

Ben Halstead, Yun Sing Koh, Patricia Riddle, Mykola Pechenizkiy, Albert Bifet, Russel Pears2026-03-13🤖 cs.LG

Graph Tokenization for Bridging Graphs and Transformers

この論文は、可逆的なグラフ直列化と BPE を組み合わせてグラフをシーケンス表現に変換する新しいトークナイザを提案し、アーキテクチャの変更なしに Transformer をグラフデータに適用可能にし、14 のベンチマークで最先端の性能を達成したことを示しています。

Zeyuan Guo, Enmao Diao, Cheng Yang, Chuan Shi2026-03-13🤖 cs.LG

Task-Conditioned Routing Signatures in Sparse Mixture-of-Experts Transformers

本論文は、スパースな混合専門家（MoE）トランスフォーマーにおいて、異なるタスクが層を超えた専門家の活性化パターンを要約する「ルーティング署名」として明確に区別可能であることを実証し、ルーティングメカニズムが単なる負荷分散ではなくタスクに敏感な計算の構成要素であることを示しています。

Mynampati Sri Ranganadha Avinash2026-03-13🤖 cs.LG

A Learning-Based Superposition Operator for Non-Renewal Arrival Processes in Queueing Networks

この論文は、一般の非再生到着過程の重ね合わせを解析的に扱う難しさを克服するため、合成データで訓練された深層学習モデルを用いて、複数の到着ストリームの低次モーメントと自己相関を高精度に推定するスケーラブルな学習ベースの重ね合わせ演算子を提案し、これにより複雑な待ち行列ネットワークの分布性能解析を可能にするものである。

Eliran Sherzer2026-03-13🤖 cs.LG

Group Resonance Network: Learnable Prototypes and Multi-Subject Resonance for EEG Emotion Recognition

本論文は、被験者間の個人差に起因する課題を解決するため、個々の脳波ダイナミクスと学習可能なグループプロトタイプおよび多被験者共鳴モデルを統合した「グループ共鳴ネットワーク（GRN）」を提案し、感情認識タスクにおいて既存手法を上回る性能を達成したことを報告しています。

Renwei Meng2026-03-13🤖 cs.LG

High-resolution weather-guided surrogate modeling for data-efficient cross-location building energy prediction

本研究は、複数の地域に共通する短期の気象・エネルギー需要パターンを捉える高解像度の気象情報に基づく代理モデルを提案し、単一の地点での学習のみで異なる気候帯の建物エネルギー需要を高精度に予測可能にするデータ効率性の高い手法を開発した。

Piragash Manmatharasan, Girma Bitsuamlak, Katarina Grolinger2026-03-13🤖 cs.LG

Co-Diffusion: An Affinity-Aware Two-Stage Latent Diffusion Framework for Generalizable Drug-Target Affinity Prediction

本論文は、冷たいスタートやドメインシフトといった課題に対処し、未見の分子スキャフォールドやタンパク質ファミリーに対する汎化性能を飛躍的に向上させるため、アフィニティを考慮した潜在拡散モデル「Co-Diffusion」を提案し、その有効性を示しています。

Yining Qian, Pengjie Wang, Yixiao Li, An-Yang Lu, Cheng Tan, Shuang Li, Lijun Liu2026-03-13📊 stat

Efficient Approximation to Analytic and $L^p$ functions by Height-Augmented ReLU Networks

この論文は、 sawtooth 関数の効率的な表現を可能にする 3 次元のネットワークアーキテクチャを導入することで、解析関数および $L^p$ 関数に対する指数関数的かつ非漸近的な高精度近似を実現し、パラメータ効率の向上に寄与する理論的基盤を確立したものである。

ZeYu Li, FengLei Fan, TieYong Zeng2026-03-13📊 stat

Beyond Barren Plateaus: A Scalable Quantum Convolutional Architecture for High-Fidelity Image Classification

本論文は、局所コスト関数とハードウェア効率的なテンソルネットワーク初期化戦略を用いてバレーン・プレートーを解決し、MNIST 画像分類で 98.7% の高精度を達成するとともに、同等の古典的 CNN よりも遥かに少ないパラメータで収束するスケーラブルな量子畳み込みニューラルネットワークを提案するものである。

Radhakrishnan Delhibabu2026-03-13🤖 cs.LG

Higher-Order Modular Attention: Fusing Pairwise and Triadic Interactions for Protein Sequences

この論文は、タンパク質配列におけるペアワイズ相互作用だけでなく、より複雑な三項相互作用を明示的に統合した「Higher-Order Modular Attention（HOMA）」を提案し、タンパク質の二次構造や安定性などの予測タスクにおいて、標準的な自己注意機構や既存の効率的な変種を上回る性能を達成したことを報告しています。

Shirin Amiraslani, Xin Gao2026-03-13🤖 cs.LG

Conformal e-prediction in the presence of confounding

この論文は、観測された共変量とラベルの間に交絡が存在する状況、および観測データが独立同一分布（IID）である場合とある程度の依存性が許容される場合の両方において、コンフォーマル e-予測を拡張する手法を提案しています。

Vladimir Vovk, Ruodu Wang2026-03-13📊 stat

Scaling Reasoning Efficiently via Relaxed On-Policy Distillation

本論文は、教師モデルからの報酬を柔軟に活用する「REOPOLD」というフレームワークを提案し、オンポリシー蒸留の不安定さを解消するとともに、数学や視覚、エージェントタスクにおいて従来の強化学習手法を凌駕するサンプル効率と推論時のスケーリング性能を実現することを示しています。

Jongwoo Ko, Sara Abdali, Young Jin Kim, Tianyi Chen, Pashmina Cameron2026-03-13🤖 cs.LG

Deep regression learning from dependent observations with minimum error entropy principle

本論文は、最小誤差エントロピー原理に基づく非ペナルティ化およびスパースペナルティ化深層ニューラルネットワークを用いて、強混合条件下の非パラメトリック回帰問題における期待過剰リスクの上限を導出し、ガウス誤差モデルにおいてSchmidtらによって確立された下限と一致する（対数因子を除く）最小最大収束率を達成することを示しています。

William Kengne, Modou Wade2026-03-13📊 stat

H2LooP Spark Preview: Continual Pretraining of Large Language Models for Low-Level Embedded Systems Code

本論文は、組み込みシステム分野の専門知識に特化した継続的事前学習パイプライン「H2LooP Spark Preview」を導入し、70 億パラメータのオープンモデルを低レベルコード生成において 300 億パラメータ級の大規模モデルや最先端モデルと同等以上の性能を発揮させることに成功したことを報告しています。

Amit Singh, Vedant Nipane, Pulkit Agrawal, Jatin Kishnani2026-03-13🤖 cs.LG

Procedural Fairness via Group Counterfactual Explanation

この論文は、機械学習モデルの予測に至るプロセスの公平性を確保するため、異なる保護グループ間での説明の一貫性を強制する正則化フレームワーク「GCIG」を提案し、予測性能を維持しつつ説明の格差を大幅に削減できることを実証しています。

Gideon Popoola, John Sheppard2026-03-13🤖 cs.LG

← 前へ次へ →

cs.LG