Partition-Based Functional Ridge Regression for High-Dimensional Data

この論文は、高次元関数線形モデルにおける多重共線性や過学習の問題を解決し、解釈性を向上させるために、係数関数を支配的効果と微弱効果に分割して異なるリッジ正則化を適用する「分割ベースの関数リッジ回帰」フレームワークを提案し、その理論的性質と実データへの有効性を示しています。

Shaista Ashraf, Ismail Shah, Farrukh JavedFri, 13 Ma📊 stat

Co-Diffusion: An Affinity-Aware Two-Stage Latent Diffusion Framework for Generalizable Drug-Target Affinity Prediction

本論文は、冷たいスタートやドメインシフトといった課題に対処し、未見の分子スキャフォールドやタンパク質ファミリーに対する汎化性能を飛躍的に向上させるため、アフィニティを考慮した潜在拡散モデル「Co-Diffusion」を提案し、その有効性を示しています。

Yining Qian, Pengjie Wang, Yixiao Li, An-Yang Lu, Cheng Tan, Shuang Li, Lijun LiuFri, 13 Ma📊 stat

Deep regression learning from dependent observations with minimum error entropy principle

本論文は、最小誤差エントロピー原理に基づく非ペナルティ化およびスパースペナルティ化深層ニューラルネットワークを用いて、強混合条件下の非パラメトリック回帰問題における期待過剰リスクの上限を導出し、ガウス誤差モデルにおいてSchmidtらによって確立された下限と一致する(対数因子を除く)最小最大収束率を達成することを示しています。

William Kengne, Modou WadeFri, 13 Ma📊 stat

Algorithmic Capture, Computational Complexity, and Inductive Bias of Infinite Transformers

本論文は、無限幅トランスフォーマーが「アルゴリズム的キャプチャ(グロッキング)」を達成する能力を定義し、その推論時の計算量に上限があることを示すことで、効率的な多項式時間ヒューリスティックスキーム(EPTHS)に属する低複雑度アルゴリズムへの誘導バイアスが存在し、より高複雑度アルゴリズムの習得は困難であることを理論的に証明しています。

Orit Davidovich, Zohar RingelFri, 13 Ma🤖 cs.LG

RIE-Greedy: Regularization-Induced Exploration for Contextual Bandits

本論文は、モデル学習過程における交差検証に基づく正則化の確率的性質が、ブラックボックス推定器を用いた文脈付きバンドット問題において、トンプソンサンプリングと理論的に同等の探索を自然に誘発することを示し、大規模実環境において従来の手法を上回る性能を達成する「RIE-Greedy」という新たな手法を提案している。

Tong Li, Thiago de Queiroz Casanova, Eric M. Schwartz, Victor Kostyuk, Dehan Kong, Joseph J. WilliamsFri, 13 Ma📊 stat

Outrigger local polynomial regression

この論文は、誤差分布の仮定に依存せず、条件付きスコア関数の推定値と広域のデータを用いた「アウトリッガー」機構によって安定性を確保しつつ、ホルダークラスにおける最小最大最適性を達成する新しい局所多項式回帰推定量「アウトリッガー」を提案し、その理論的性質と実データでの有効性を検証したものである。

Elliot H. Young, Rajen D. Shah, Richard J. SamworthFri, 13 Ma📊 stat

On the Robustness of Langevin Dynamics to Score Function Error

この論文は、学習データから推定されたスコア関数に任意に小さな誤差が含まれる場合でも、高次元の単純な分布においてランジュバンダイナミクスが目標分布から遠く離れた分布を生成してしまうことを示し、拡散モデルに対するそのロバスト性の欠如を指摘しています。

Daniel Yiming Cao, August Y. Chen, Karthik Sridharan, Yuchen WuFri, 13 Ma🤖 cs.LG

Spatially Robust Inference with Predicted and Missing at Random Labels

この論文は、機械学習による予測ラベルと空間的依存性を伴う欠損データ下での統計的推論において、クロスフィットによる折れレベルの相関が空間分散推定を歪める問題を解決し、ジャックナイフ法に基づく空間 HAC 分散補正を導入することで、漸近的に有効な信頼区間を構築する二重頑健推定量を提案しています。

Stephen Salerno, Zhenke Wu, Tyler McCormickFri, 13 Ma📈 econ

Exploiting Expertise of Non-Expert and Diverse Agents in Social Bandit Learning: A Free Energy Approach

この論文は、報酬の知識がない他者の行動のみを観測する社会型バンディット学習において、オラクルや社会的規範に依存せずに他者の専門性を推定し、直接経験と他者の推定ポリシーを統合する自由エネルギーベースのアルゴリズムを提案し、その最適ポリシーへの収束性と、非専門家を含む多様なエージェント集団における学習性能の向上を実証的に示したものである。

Erfan Mirzaei, Seyed Pooya Shariatpanahi, Alireza Tavakoli, Reshad Hosseini, Majid Nili AhmadabadiFri, 13 Ma📊 stat

A Further Efficient Algorithm with Best-of-Both-Worlds Guarantees for mm-Set Semi-Bandit Problem

本論文は、mm-集合半バンドット問題において、フリーチェ分布やパレート分布を用いたフォロウ・ザ・パーターブド・リーダー(FTPL)アルゴリズムが、敵対的設定で最適な regret 境界 O(mdT)O(\sqrt{mdT}) を達成し、確率的設定でも対数 regret を達成する「両方の世界における最適性」を有することを示すと同時に、条件付き幾何学的リサンプリングを拡張することで計算複雑性を O(md(log(d/m)+1))O(md(\log(d/m)+1)) まで削減する効率的なアルゴリズムを提案しています。

Botao Chen, Jongyeong Lee, Chansoo Kim, Junya HondaFri, 13 Ma📊 stat

Language Generation with Replay: A Learning-Theoretic View of Model Collapse

本論文は、学習理論の枠組みを用いて、生成モデルの出力が学習データに再流入する「リプレイ」が、生成の強弱の定義によってモデル崩壊を誘発する条件を理論的に解明し、実務で用いられるデータクリーニングなどの手法の有効性と限界を明らかにしたものである。

Giorgio Racca, Michal Valko, Amartya SanyalFri, 13 Ma📊 stat

Data Fusion with Distributional Equivalence Test-then-pool

この論文は、歴史的対照群と現在の対照群の分布を最大平均不一致(MMD)と同等性検定を用いて評価し、部分的なブートストラップ法やパーミュテーション法によって第一種過誤を厳密に制御しながら、より高い検出力を実現する新しい「テスト・テン・プール」フレームワークを提案するものである。

Linying Yang, Xing Liu, Robin J. EvansFri, 13 Ma📊 stat

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

本論文は、確率論的学習パラダイムである「engression」とトランスフォーマーの表現力を統合し、パラメトリックな仮定を課さずに複雑な多変量予測分布を直接学習することで、高品質な確率論的予測を実現する深層生成モデル「EnTransformer」を提案し、複数のベンチマークデータセットにおいて既存モデルを上回る性能を実証したものである。

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit ChakrabortyFri, 13 Ma📊 stat

Uncovering Locally Low-dimensional Structure in Networks by Locally Optimal Spectral Embedding

この論文は、大域的低ランク仮定に依存する従来の手法の限界を克服し、重み付きスペクトル分解を用いて局所的な低次元構造を抽出する「局所隣接スペクトラル埋め込み(LASE)」を提案し、その理論的保証と実ネットワークにおける高品質な可視化への有効性を示しています。

Hannah Sansford, Nick Whiteley, Patrick Rubin-DelanchyFri, 13 Ma📊 stat