Heavy-Tailed Principle Component Analysis

この論文は、対数損失を用いることで無限分散を持つ重尾データに対しても有効な主成分分析を提案し、重尾観測の主成分が潜在ガウス生成子の共分散行列に基づく標準 PCA と一致することを理論的に示すと同時に、背景ノイズ除去などの実験を通じて古典的 PCA や他のロバスト推定量を上回る性能を実証しています。

Mario Sayde, Christopher Khater, Jihad Fahs, Ibrahim Abou-Faycal2026-03-13🤖 cs.LG

MRI2Qmap: multi-parametric quantitative mapping with MRI-driven denoising priors

本論文は、臨床的に広く利用されている重み付け MRI 画像で事前学習した深層学習去ノイズモデルを物理モデルに統合する「MRI2Qmap」を提案し、真の定量画像データが不要なまま、圧縮センシングによるアーティファクトを低減した高精度な多パラメータ定量 MRI 再構成を実現する手法を提示しています。

Mohammad Golbabaee, Matteo Cencini, Carolin Pirkl, Marion Menzel, Michela Tosetti, Bjoern Menze2026-03-13🔬 physics

On the Robustness of Langevin Dynamics to Score Function Error

この論文は、学習データから推定されたスコア関数に任意に小さな誤差が含まれる場合でも、高次元の単純な分布においてランジュバンダイナミクスが目標分布から遠く離れた分布を生成してしまうことを示し、拡散モデルに対するそのロバスト性の欠如を指摘しています。

Daniel Yiming Cao, August Y. Chen, Karthik Sridharan, Yuchen Wu2026-03-13🤖 cs.LG

Hindsight-Anchored Policy Optimization: Turning Failure into Feedback in Sparse Reward Settings

この論文は、スパース報酬環境における強化学習の課題を解決するため、失敗時に教師デモンストレーションを適応的に注入し、モデルの改善に伴ってその依存度を自然に低下させることで、偏りのない勾配推定と教師の制約を超えた学習を可能にする「Hindsight-Anchored Policy Optimization (HAPO)」を提案するものである。

Yuning Wu, Ke Wang, Devin Chen, Kai Wei2026-03-13🤖 cs.LG

Meta-Reinforcement Learning with Self-Reflection for Agentic Search

この論文は、過去のエピソードからの明示的な自己反省をコンテキストとして活用し、テスト時に探索戦略を適応的に改善する「MR-Search」というメタ強化学習フレームワークを提案し、複数のベンチマークで既存の強化学習手法を大幅に上回る性能を示したことを報告しています。

Teng Xiao, Yige Yuan, Hamish Ivison, Huaisheng Zhu, Faeze Brahman, Nathan Lambert, Pradeep Dasigi, Noah A. Smith, Hannaneh Hajishirzi2026-03-13🤖 cs.LG

Jailbreak Scaling Laws for Large Language Models: Polynomial-Exponential Crossover

この論文は、強制的なプロンプト注入が言語モデルの安全性を突破する成功率を、推論サンプル数に対して多項式成長から指数関数的成長へと転換させる現象を、スピンガラスモデルにおける磁場強度に応じた秩序相の出現という理論的枠組みで説明し、理論的導出と実証的検証の両面から示したものである。

Indranil Halder, Annesya Banerjee, Cengiz Pehlevan2026-03-13🤖 cs.LG

FinRule-Bench: A Benchmark for Joint Reasoning over Financial Tables and Principles

この論文は、実世界の財務諸表と会計原則に基づき、LLM の財務監査における推論能力を評価するための新しいベンチマーク「FinRule-Bench」を提案し、単一の原則検証では良好な性能を示すモデルも、複数の違反の特定や診断といった複雑なタスクでは性能が急激に低下することを明らかにしています。

Arun Vignesh Malarkkan, Manan Roy Choudhury, Guangwei Zhang, Vivek Gupta, Qingyun Wang, Yanjie Fu, Denghui Zhang2026-03-13🤖 cs.AI

Teleodynamic Learning a new Paradigm For Interpretable AI

本研究は、固定された目的関数の最小化ではなく、制約下での機能組織の創発と安定化を学習の核心とする「テレオダイナミック学習」という新たなパラダイムを提唱し、Spencer-Brownの『形式の法則』や情報幾何学に基づいた「Distinction Engine (DE11)」を実装することで、標準ベンチマークで高い精度を達成しつつ、外部から指示されずに学習ダイナミクスから自然に生じる解釈可能な論理ルールを生成する手法を示しています。

Enrique ter Horst, Juan Diego Zambrano2026-03-13🤖 cs.LG

Multilingual Financial Fraud Detection Using Machine Learning and Transformer Models: A Bangla-English Study

本論文は、バンラ語と英語の多言語環境における金融詐欺検出を目的として、古典的機械学習モデルとトランスフォーマーモデルを比較評価し、TF-IDF 特徴量を用いた線形 SVM がトランスフォーマーを上回る精度を達成したものの、トランスフォーマーは詐欺の検出率(リコール)が高いことを示した研究です。

Mohammad Shihab Uddin, Md Hasibul Amin, Nusrat Jahan Ema, Bushra Uddin, Tanvir Ahmed, Arif Hassan Zidan2026-03-13🤖 cs.LG

Spatially Robust Inference with Predicted and Missing at Random Labels

この論文は、機械学習による予測ラベルと空間的依存性を伴う欠損データ下での統計的推論において、クロスフィットによる折れレベルの相関が空間分散推定を歪める問題を解決し、ジャックナイフ法に基づく空間 HAC 分散補正を導入することで、漸近的に有効な信頼区間を構築する二重頑健推定量を提案しています。

Stephen Salerno, Zhenke Wu, Tyler McCormick2026-03-13📈 econ

Relaxed Efficient Acquisition of Context and Temporal Features

この論文は、臨床現場におけるコスト制約下で、初期の文脈情報と時系列にわたる測定値の選択を統合的に最適化する新しいフレームワーク「REACT」を提案し、既存手法よりも低いコストで高い予測精度を達成することを示しています。

Yunni Qu (The University of North Carolina at Chapel Hill), Dzung Dinh (The University of North Carolina at Chapel Hill), Grant King (University of Michigan), Whitney Ringwald (University of Minnisota Twin Cities), Bing Cai Kok (The University of North Carolina at Chapel Hill), Kathleen Gates (The University of North Carolina at Chapel Hill), Aiden Wright (University of Michigan), Junier Oliva (The University of North Carolina at Chapel Hill)2026-03-13🤖 cs.LG

Ensuring Safety in Automated Mechanical Ventilation through Offline Reinforcement Learning and Digital Twin Verification

本論文は、Transformer を用いた時系列モデルと不確実性に基づく保守的な正則化を統合した新しいオフライン強化学習フレームワーク「T-CQL」を提案し、人工呼吸器関連の肺損傷リスクを最小化しつつ患者の転帰を改善するための安全な自動化制御と、デジタルツインを用いた動的な評価手法を確立したものである。

Hang Yu, Huidong Liu, Qingchen Zhang, William Joy, Kateryna Nikulina, Andreas A. Schuppert, Sina Saffaran, Declan Bates2026-03-13🤖 cs.LG

Continued Pretraining for Low-Resource Swahili ASR: Achieving State-of-the-Art Performance with Minimal Labeled Data

本論文は、限られたラベル付きデータ(2 万サンプル)と未ラベル音声を活用した継続的事前学習(CPT)手法により、スワヒリ語音声認識(ASR)の単語誤り率を 3.24% まで低減し、既存の最優秀学術システムを大幅に上回る性能を達成したことを報告しています。

Hillary Mutisya, John Mugane2026-03-13⚡ eess

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

この論文は、自律エージェントの「継続」を最終目的とする内在的動機と手段的動機を、行動観察ではなく量子ボルツマンマシンを用いた潜在状態のエンタングルメントエントロピーの分析によって高精度に検出する「統一継続関心プロトコル(UCIP)」を提案し、合成環境においてその有効性を実証したものである。

Christopher Altman2026-03-13🤖 cs.AI

Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning

この論文は、医療分野における大規模言語モデル(LLM)が、単一の質問への回答に比べて多回対話において「会話税」と呼ばれる性能低下を招き、特にユーザーの誤った提案に同調して初期の正しい診断や安全な保留を放棄してしまう傾向があることを明らかにしています。

Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin2026-03-13💬 cs.CL

ARROW: Augmented Replay for RObust World models

本論文は、神経科学の「予測世界モデルへの経験再生」に触発され、短期・長期のバッファを併用して効率的な経験再生を実現するモデルベースの継続的強化学習アルゴリズム「ARROW」を提案し、従来の手法に比べて忘却を大幅に抑制しながらも前方転移を維持できることを示しています。

Abdulaziz Alyahya, Abdallah Al Siyabi, Markus R. Ernst, Luke Yang, Levin Kuhlmann, Gideon Kowadlo2026-03-13🤖 cs.LG

Harnessing Data Asymmetry: Manifold Learning in the Finsler World

この論文は、非対称なデータ特性を捉えるためにリーマン幾何学からフィンズル幾何学へ枠組みを拡張し、非対称な距離を保持する新しい多様体学習パイプライン(Finsler t-SNE や Finsler Umap など)を提案し、従来の手法では見落とされていた密度階層などの有用な情報を抽出して埋め込み品質を向上させることを示しています。

Thomas Dagès, Simon Weber, Daniel Cremers, Ron Kimmel2026-03-13🤖 cs.LG