Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

本論文は、拡張動的モード分解(EDMD)を用いたクーマン演算子とウェーブレット変換の特徴をトランスフォーマーと組み合わせることで、心電図(ECG)の多クラス分類において、特に適切な辞書選択により従来のウェーブレット単独やハイブリッド手法を上回る性能を達成し、動的システム理論に基づく時系列分類の有効性を示したものである。

Sucheta Ghosh, Zahra Monfared2026-03-10🤖 cs.LG

M3^3-ACE: Rectifying Visual Perception in Multimodal Math Reasoning via Multi-Agentic Context Engineering

本論文は、視覚的数学推論における誤った視覚知覚を修正するため、複数のエージェントが視覚証拠リストを共有・協調して知覚と推論を分離し、要約・洗練ツールを用いて矛盾を解消する「M3-ACE」フレームワークを提案し、MathVision などのベンチマークで新最高記録を達成したことを報告しています。

Peijin Xie, Zhen Xu, Bingquan Liu, Baoxun Wang2026-03-10💻 cs

A Hierarchical Error-Corrective Graph Framework for Autonomous Agents with LLM-Based Action Generation

本論文は、マルチディメンショナルな戦略転移、構造化されたエラー分類、および因果コンテキストに基づくグラフ検索という 3 つの中核的革新を取り入れた「階層的エラー修正グラフフレームワーク(HECG)」を提案し、自律エージェントが複雑なタスクにおいて戦略の精度を高め、失敗の根本原因を特定して修正し、動的環境での実行信頼性を向上させることを可能にします。

Cong Cao, Jingyao Zhang, Kun Tong2026-03-10💻 cs

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

本論文は、LLM が生成トークンの条件付けによって行動を柔軟に切り替えられる「変幻自在性」を発見し、これを強化学習で定着させるフレームワーク「ToCoRL」を提案することで、推論モデルの能力を維持しつつ事実問答などへの適応を可能にしたことを示しています。

Liyuan Mao, Le Yu, Jing Zhou, Chujie Zheng, Bowen Yu, Chang Gao, Shixuan Liu, An Yang, Weinan Zhang, JunYang Lin2026-03-10🤖 cs.LG

Geometrically Constrained Outlier Synthesis

この論文は、学習データの特徴空間の多様体構造を尊重して仮想外れ値を合成する「幾何学的制約付き外れ値合成(GCOS)」という正則化フレームワークを提案し、既知の分布内データと共有する意味領域における外れ値検出の性能を向上させ、さらに統計的に有効な誤り保証を持つ不確実性スコアへの拡張も可能にするものである。

Daniil Karzanov, Marcin Detyniecki2026-03-10🤖 cs.LG

IronEngine: Towards General AI Assistant

本論文は、デスクトップ UI、多様な API、ローカルおよびクラウドモデル、持続的メモリ、タスクスケジューリング、MCP 互換性などを統合したユニファイド・オーケストレーションコアを中核とし、計画と実行を分離する 3 フェーズパイプラインや適応的なモデル管理、高度なツールルーティングを備えた汎用 AI アシスタントプラットフォーム「IronEngine」のアーキテクチャ、設計、性能、および他システムとの比較分析を提示するものである。

Xi Mo2026-03-10🤖 cs.LG

Efficient Policy Learning with Hybrid Evaluation-Based Genetic Programming for Uncertain Agile Earth Observation Satellite Scheduling

本論文は、不確実性を伴うアジャイル地球観測衛星のスケジューリング問題に対し、正確な評価と近似評価を動的に切り替えるハイブリッド評価メカニズムを組み込んだ遺伝的プログラミング超ヒューリスティック(HE-GP)を提案し、計算コストを大幅に削減しながら既存手法を上回る高性能なスケジューリングポリシーを効率的に学習可能であることを示しています。

Junhua Xue, Yuning Chen2026-03-10💻 cs

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

この研究は、リアルタイムの安全監視下で実施された前向き臨床feasibility 研究において、LLM ベースの対話型 AI「AMIE」が、患者の満足度向上や医師の準備性への貢献、そして診断精度において医療従事者と同等の安全性と質を有し、実際のプライマリケア現場での導入可能性を実証したことを示しています。

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam Rodman2026-03-10🤖 cs.LG

LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing

LycheeCluster は、境界認識によるチャンキングと三角形不等式に基づく階層的 KV インデックスを導入することで、長文脈推論における KV キャッシュ管理を線形探索から対数時間への剪定プロセスへと変換し、モデル性能の低下を最小限に抑えつつ最大 3.6 倍の推論高速化を実現する手法です。

Dongfang Li, Zixuan Liu, Gang Lin, Baotian Hu, Min Zhang2026-03-10🤖 cs.LG

The Boiling Frog Threshold: Criticality and Blindness in World Model-Based Anomaly Detection Under Gradual Drift

この論文は、強化学習エージェントが世界モデルに基づく自己監視を行う際、観測の漸進的なドリフトに対して検知閾値が普遍的存在し、その検知能力がノイズフロア、検出器、環境ダイナミクスという 3 者の相互作用によって決定されることを実証的に明らかにし、特に脆弱な環境ではエージェントが検知前に崩壊する「無自覚な破綻」モードが存在することを示しています。

Zhe Hong2026-03-10🤖 cs.LG

R2F: Repurposing Ray Frontiers for LLM-free Object Navigation

本論文は、推論時の遅延や計算コストを削減しつつリアルタイム性を確保するため、大規模言語モデル(LLM)や視覚言語モデル(VLM)に依存せず、レイフロントを意味的仮説として再解釈した「R2F」という新しい室内オープンボキャブラリー物体ナビゲーションフレームワークを提案し、実機実験で既存の VLM ベース手法より最大 6 倍高速な実行を実現したことを報告しています。

Francesco Argenziano, John Mark Alexis Marcelo, Michele Brienza, Abdel Hakim Drid, Emanuele Musumeci, Daniele Nardi, Domenico D. Bloisi, Vincenzo Suriani2026-03-10💻 cs

X-AVDT: Audio-Visual Cross-Attention for Robust Deepfake Detection

本論文は、生成モデル内部の音声・映像クロスアテンション機構が持つ微細な整合性情報を DDIM 逆変換を通じて抽出する「X-AVDT」という堅牢なディープフェイク検出器と、多様な生成手法を網羅する新たなデータセット「MMDF」を提案し、既存手法を大幅に上回る汎化性能を実証したものである。

Youngseo Kim, Kwan Yun, Seokhyeon Hong, Sihun Cha, Colette Suhjung Koo, Junyong Noh2026-03-10🤖 cs.LG

Visual Self-Fulfilling Alignment: Shaping Safety-Oriented Personas via Threat-Related Images

この論文は、安全ラベルを必要とせず、脅威に関連する画像を用いた中立な VQA タスクへの微調整を通じて、視覚的入力に対する有害な出力を抑制し、安全性に配慮したモデルの振る舞いを誘発する「視覚的自己実現型アライメント(VSFA)」という新たな手法を提案し、その有効性を検証したものである。

Qishun Yang, Shu Yang, Lijie Hu, Di Wang2026-03-10💻 cs