cs.LG 件の論文 | Gist.Science

Heavy-Tailed Principle Component Analysis

この論文は、対数損失を用いることで無限分散を持つ重尾データに対しても有効な主成分分析を提案し、重尾観測の主成分が潜在ガウス生成子の共分散行列に基づく標準 PCA と一致することを理論的に示すと同時に、背景ノイズ除去などの実験を通じて古典的 PCA や他のロバスト推定量を上回る性能を実証しています。

Mario Sayde, Christopher Khater, Jihad Fahs, Ibrahim Abou-Faycal2026-03-13🤖 cs.LG

MRI2Qmap: multi-parametric quantitative mapping with MRI-driven denoising priors

本論文は、臨床的に広く利用されている重み付け MRI 画像で事前学習した深層学習去ノイズモデルを物理モデルに統合する「MRI2Qmap」を提案し、真の定量画像データが不要なまま、圧縮センシングによるアーティファクトを低減した高精度な多パラメータ定量 MRI 再構成を実現する手法を提示しています。

Mohammad Golbabaee, Matteo Cencini, Carolin Pirkl, Marion Menzel, Michela Tosetti, Bjoern Menze2026-03-13🔬 physics

On the Robustness of Langevin Dynamics to Score Function Error

この論文は、学習データから推定されたスコア関数に任意に小さな誤差が含まれる場合でも、高次元の単純な分布においてランジュバンダイナミクスが目標分布から遠く離れた分布を生成してしまうことを示し、拡散モデルに対するそのロバスト性の欠如を指摘しています。

Daniel Yiming Cao, August Y. Chen, Karthik Sridharan, Yuchen Wu2026-03-13🤖 cs.LG

Hindsight-Anchored Policy Optimization: Turning Failure into Feedback in Sparse Reward Settings

この論文は、スパース報酬環境における強化学習の課題を解決するため、失敗時に教師デモンストレーションを適応的に注入し、モデルの改善に伴ってその依存度を自然に低下させることで、偏りのない勾配推定と教師の制約を超えた学習を可能にする「Hindsight-Anchored Policy Optimization (HAPO)」を提案するものである。

Yuning Wu, Ke Wang, Devin Chen, Kai Wei2026-03-13🤖 cs.LG

Meta-Reinforcement Learning with Self-Reflection for Agentic Search

この論文は、過去のエピソードからの明示的な自己反省をコンテキストとして活用し、テスト時に探索戦略を適応的に改善する「MR-Search」というメタ強化学習フレームワークを提案し、複数のベンチマークで既存の強化学習手法を大幅に上回る性能を示したことを報告しています。

Teng Xiao, Yige Yuan, Hamish Ivison, Huaisheng Zhu, Faeze Brahman, Nathan Lambert, Pradeep Dasigi, Noah A. Smith, Hannaneh Hajishirzi2026-03-13🤖 cs.LG

Ill-Conditioning in Dictionary-Based Dynamic-Equation Learning: A Systems Biology Case Study

本論文は、システム生物学におけるデータ駆動型の動的方程式学習において、候補関数間の強い相関が数値的不安定性を引き起こす問題を検討し、直交多項式基底の選択とデータ分布の整合性がモデルの精度回復に重要であることを示しています。

Yuxiang Feng, Niall M Mangan, Manu Jayadharan2026-03-13🧬 q-bio

Jailbreak Scaling Laws for Large Language Models: Polynomial-Exponential Crossover

この論文は、強制的なプロンプト注入が言語モデルの安全性を突破する成功率を、推論サンプル数に対して多項式成長から指数関数的成長へと転換させる現象を、スピンガラスモデルにおける磁場強度に応じた秩序相の出現という理論的枠組みで説明し、理論的導出と実証的検証の両面から示したものである。

Indranil Halder, Annesya Banerjee, Cengiz Pehlevan2026-03-13🤖 cs.LG

On the Computational Hardness of Transformers

この論文は、SETH や行列乗算の指数 $\omega$ に基づき、マルチヘッド・多層トランスフォーマーの計算が独立した注意機構の計算を効率化できないことを示し、初となる非自明な計算量下限を確立した。

Barna Saha, Yinzhan Xu, Christopher Ye, Hantao Yu2026-03-13🤖 cs.LG

FinRule-Bench: A Benchmark for Joint Reasoning over Financial Tables and Principles

この論文は、実世界の財務諸表と会計原則に基づき、LLM の財務監査における推論能力を評価するための新しいベンチマーク「FinRule-Bench」を提案し、単一の原則検証では良好な性能を示すモデルも、複数の違反の特定や診断といった複雑なタスクでは性能が急激に低下することを明らかにしています。

Arun Vignesh Malarkkan, Manan Roy Choudhury, Guangwei Zhang, Vivek Gupta, Qingyun Wang, Yanjie Fu, Denghui Zhang2026-03-13🤖 cs.AI

Teleodynamic Learning a new Paradigm For Interpretable AI

本研究は、固定された目的関数の最小化ではなく、制約下での機能組織の創発と安定化を学習の核心とする「テレオダイナミック学習」という新たなパラダイムを提唱し、Spencer-Brownの『形式の法則』や情報幾何学に基づいた「Distinction Engine (DE11)」を実装することで、標準ベンチマークで高い精度を達成しつつ、外部から指示されずに学習ダイナミクスから自然に生じる解釈可能な論理ルールを生成する手法を示しています。

Enrique ter Horst, Juan Diego Zambrano2026-03-13🤖 cs.LG

Multilingual Financial Fraud Detection Using Machine Learning and Transformer Models: A Bangla-English Study

本論文は、バンラ語と英語の多言語環境における金融詐欺検出を目的として、古典的機械学習モデルとトランスフォーマーモデルを比較評価し、TF-IDF 特徴量を用いた線形 SVM がトランスフォーマーを上回る精度を達成したものの、トランスフォーマーは詐欺の検出率（リコール）が高いことを示した研究です。

Mohammad Shihab Uddin, Md Hasibul Amin, Nusrat Jahan Ema, Bushra Uddin, Tanvir Ahmed, Arif Hassan Zidan2026-03-13🤖 cs.LG

Spatially Robust Inference with Predicted and Missing at Random Labels

この論文は、機械学習による予測ラベルと空間的依存性を伴う欠損データ下での統計的推論において、クロスフィットによる折れレベルの相関が空間分散推定を歪める問題を解決し、ジャックナイフ法に基づく空間 HAC 分散補正を導入することで、漸近的に有効な信頼区間を構築する二重頑健推定量を提案しています。

Stephen Salerno, Zhenke Wu, Tyler McCormick2026-03-13📈 econ

abx_amr_simulator: A simulation environment for antibiotic prescribing policy optimization under antimicrobial resistance

この論文は、抗菌薬耐性（AMR）のダイナミクスをモデル化し、不確実性下での抗菌薬処方政策の最適化を可能にする、強化学習互換の Python 製シミュレーション環境「abx_amr_simulator」を紹介しています。

Joyce Lee, Seth Blumberg2026-03-13🧬 q-bio

Relaxed Efficient Acquisition of Context and Temporal Features

この論文は、臨床現場におけるコスト制約下で、初期の文脈情報と時系列にわたる測定値の選択を統合的に最適化する新しいフレームワーク「REACT」を提案し、既存手法よりも低いコストで高い予測精度を達成することを示しています。

Yunni Qu (The University of North Carolina at Chapel Hill), Dzung Dinh (The University of North Carolina at Chapel Hill), Grant King (University of Michigan), Whitney Ringwald (University of Minnisota Twin Cities), Bing Cai Kok (The University of North Carolina at Chapel Hill), Kathleen Gates (The University of North Carolina at Chapel Hill), Aiden Wright (University of Michigan), Junier Oliva (The University of North Carolina at Chapel Hill)2026-03-13🤖 cs.LG

← 前へ次へ →

cs.LG