cs.LG 件の論文 | Gist.Science

FinRule-Bench: A Benchmark for Joint Reasoning over Financial Tables and Principles

この論文は、実世界の財務諸表と会計原則に基づき、LLM の財務監査における推論能力を評価するための新しいベンチマーク「FinRule-Bench」を提案し、単一の原則検証では良好な性能を示すモデルも、複数の違反の特定や診断といった複雑なタスクでは性能が急激に低下することを明らかにしています。

Arun Vignesh Malarkkan, Manan Roy Choudhury, Guangwei Zhang, Vivek Gupta, Qingyun Wang, Yanjie Fu, Denghui Zhang2026-03-13🤖 cs.AI

Teleodynamic Learning a new Paradigm For Interpretable AI

本研究は、固定された目的関数の最小化ではなく、制約下での機能組織の創発と安定化を学習の核心とする「テレオダイナミック学習」という新たなパラダイムを提唱し、Spencer-Brownの『形式の法則』や情報幾何学に基づいた「Distinction Engine (DE11)」を実装することで、標準ベンチマークで高い精度を達成しつつ、外部から指示されずに学習ダイナミクスから自然に生じる解釈可能な論理ルールを生成する手法を示しています。

Enrique ter Horst, Juan Diego Zambrano2026-03-13🤖 cs.LG

Multilingual Financial Fraud Detection Using Machine Learning and Transformer Models: A Bangla-English Study

本論文は、バンラ語と英語の多言語環境における金融詐欺検出を目的として、古典的機械学習モデルとトランスフォーマーモデルを比較評価し、TF-IDF 特徴量を用いた線形 SVM がトランスフォーマーを上回る精度を達成したものの、トランスフォーマーは詐欺の検出率（リコール）が高いことを示した研究です。

Mohammad Shihab Uddin, Md Hasibul Amin, Nusrat Jahan Ema, Bushra Uddin, Tanvir Ahmed, Arif Hassan Zidan2026-03-13🤖 cs.LG

Spatially Robust Inference with Predicted and Missing at Random Labels

この論文は、機械学習による予測ラベルと空間的依存性を伴う欠損データ下での統計的推論において、クロスフィットによる折れレベルの相関が空間分散推定を歪める問題を解決し、ジャックナイフ法に基づく空間 HAC 分散補正を導入することで、漸近的に有効な信頼区間を構築する二重頑健推定量を提案しています。

Stephen Salerno, Zhenke Wu, Tyler McCormick2026-03-13📈 econ

abx_amr_simulator: A simulation environment for antibiotic prescribing policy optimization under antimicrobial resistance

この論文は、抗菌薬耐性（AMR）のダイナミクスをモデル化し、不確実性下での抗菌薬処方政策の最適化を可能にする、強化学習互換の Python 製シミュレーション環境「abx_amr_simulator」を紹介しています。

Joyce Lee, Seth Blumberg2026-03-13🧬 q-bio

Relaxed Efficient Acquisition of Context and Temporal Features

この論文は、臨床現場におけるコスト制約下で、初期の文脈情報と時系列にわたる測定値の選択を統合的に最適化する新しいフレームワーク「REACT」を提案し、既存手法よりも低いコストで高い予測精度を達成することを示しています。

Yunni Qu (The University of North Carolina at Chapel Hill), Dzung Dinh (The University of North Carolina at Chapel Hill), Grant King (University of Michigan), Whitney Ringwald (University of Minnisota Twin Cities), Bing Cai Kok (The University of North Carolina at Chapel Hill), Kathleen Gates (The University of North Carolina at Chapel Hill), Aiden Wright (University of Michigan), Junier Oliva (The University of North Carolina at Chapel Hill)2026-03-13🤖 cs.LG

Ensuring Safety in Automated Mechanical Ventilation through Offline Reinforcement Learning and Digital Twin Verification

本論文は、Transformer を用いた時系列モデルと不確実性に基づく保守的な正則化を統合した新しいオフライン強化学習フレームワーク「T-CQL」を提案し、人工呼吸器関連の肺損傷リスクを最小化しつつ患者の転帰を改善するための安全な自動化制御と、デジタルツインを用いた動的な評価手法を確立したものである。

Hang Yu, Huidong Liu, Qingchen Zhang, William Joy, Kateryna Nikulina, Andreas A. Schuppert, Sina Saffaran, Declan Bates2026-03-13🤖 cs.LG

Continued Pretraining for Low-Resource Swahili ASR: Achieving State-of-the-Art Performance with Minimal Labeled Data

本論文は、限られたラベル付きデータ（2 万サンプル）と未ラベル音声を活用した継続的事前学習（CPT）手法により、スワヒリ語音声認識（ASR）の単語誤り率を 3.24% まで低減し、既存の最優秀学術システムを大幅に上回る性能を達成したことを報告しています。

Hillary Mutisya, John Mugane2026-03-13⚡ eess

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

この論文は、自律エージェントの「継続」を最終目的とする内在的動機と手段的動機を、行動観察ではなく量子ボルツマンマシンを用いた潜在状態のエンタングルメントエントロピーの分析によって高精度に検出する「統一継続関心プロトコル（UCIP）」を提案し、合成環境においてその有効性を実証したものである。

Christopher Altman2026-03-13🤖 cs.AI

Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning

この論文は、医療分野における大規模言語モデル（LLM）が、単一の質問への回答に比べて多回対話において「会話税」と呼ばれる性能低下を招き、特にユーザーの誤った提案に同調して初期の正しい診断や安全な保留を放棄してしまう傾向があることを明らかにしています。

Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin2026-03-13💬 cs.CL

ARROW: Augmented Replay for RObust World models

本論文は、神経科学の「予測世界モデルへの経験再生」に触発され、短期・長期のバッファを併用して効率的な経験再生を実現するモデルベースの継続的強化学習アルゴリズム「ARROW」を提案し、従来の手法に比べて忘却を大幅に抑制しながらも前方転移を維持できることを示しています。

Abdulaziz Alyahya, Abdallah Al Siyabi, Markus R. Ernst, Luke Yang, Levin Kuhlmann, Gideon Kowadlo2026-03-13🤖 cs.LG

Harnessing Data Asymmetry: Manifold Learning in the Finsler World

この論文は、非対称なデータ特性を捉えるためにリーマン幾何学からフィンズル幾何学へ枠組みを拡張し、非対称な距離を保持する新しい多様体学習パイプライン（Finsler t-SNE や Finsler Umap など）を提案し、従来の手法では見落とされていた密度階層などの有用な情報を抽出して埋め込み品質を向上させることを示しています。

Thomas Dagès, Simon Weber, Daniel Cremers, Ron Kimmel2026-03-13🤖 cs.LG

Zero-Shot Cross-City Generalization in End-to-End Autonomous Driving: Self-Supervised versus Supervised Representations

この論文は、自己教師あり学習を用いた視覚表現が、従来の教師あり学習に比べて都市間でのゼロショット一般化性能を大幅に向上させ、エンドツーエンド自動運転システムのロバスト性を高めることを示しています。

Fatemeh Naeinian, Ali Hamza, Haoran Zhu, Anna Choromanska2026-03-13🤖 cs.LG

A Stable Neural Statistical Dependence Estimator for Autoencoder Feature Analysis

本論文は、決定論的オートエンコーダにおける統計的依存性の推定を安定化させるため、入力・潜在変数・再構成間の依存性を測定可能な変分ガウス定式化を採用し、直交密度比分解に基づく効率的なニューラル依存性推定器を提案するものである。

Bo Hu, Jose C Principe2026-03-13🤖 cs.LG

ZTab: Domain-based Zero-shot Annotation for Table Columns

この論文は、ラベル付き学習データが不要で、ドメイン設定に基づいて疑似テーブルを生成し注釈用 LLM を微調整することで、大規模な意味カラムタイプの検出において性能とプライバシーを両立させるゼロショット枠組み「ZTab」を提案するものです。

Ehsan Hoseinzade, Ke Wang2026-03-13🤖 cs.LG

UniHetCO: A Unified Heterogeneous Representation for Multi-Problem Learning in Unsupervised Neural Combinatorial Optimization

本論文は、複数の組合せ最適化問題に共通する構造を単一の入力として符号化する「UniHetCO」という統一的な異種グラフ表現を提案し、教師なし学習において複数の問題クラスをまたぐ単一モデルの訓練と安定性を可能にする手法を提示しています。

Kien X. Nguyen, Ilya Safro2026-03-13🤖 cs.LG

← 前へ次へ →

cs.LG