cs.AI 件の論文 | Gist.Science

Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

本論文は、拡張動的モード分解（EDMD）を用いたクーマン演算子とウェーブレット変換の特徴をトランスフォーマーと組み合わせることで、心電図（ECG）の多クラス分類において、特に適切な辞書選択により従来のウェーブレット単独やハイブリッド手法を上回る性能を達成し、動的システム理論に基づく時系列分類の有効性を示したものである。

Sucheta Ghosh, Zahra Monfared2026-03-10🤖 cs.LG

Towards plausibility in time series counterfactual explanations

この論文は、時間系列分類問題に対して、入力空間における勾配ベースの最適化とソフトDTWに基づくk近傍法を統合することで、妥当性と分布の整合性を両立し、現実的な時間的構造を持つ反事実的説明を生成する新しい手法を提案し、その有効性を示したものである。

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}ba2026-03-10🤖 cs.LG

Computational modeling of early language learning from acoustic speech and audiovisual input without linguistic priors

本論文は、言語的事前知識を必要とせず音声および視覚情報を学習する自己教師ありモデルの進展を通じて、乳児の言語獲得のメカニズムを説明し、現代の学習シミュレーションが実証研究とより密接に結びつきつつあることをレビューするものである。

Okko Räsänen2026-03-10💬 cs.CL

M $^3$ -ACE: Rectifying Visual Perception in Multimodal Math Reasoning via Multi-Agentic Context Engineering

本論文は、視覚的数学推論における誤った視覚知覚を修正するため、複数のエージェントが視覚証拠リストを共有・協調して知覚と推論を分離し、要約・洗練ツールを用いて矛盾を解消する「M3-ACE」フレームワークを提案し、MathVision などのベンチマークで新最高記録を達成したことを報告しています。

Peijin Xie, Zhen Xu, Bingquan Liu, Baoxun Wang2026-03-10💻 cs

A Hierarchical Error-Corrective Graph Framework for Autonomous Agents with LLM-Based Action Generation

本論文は、マルチディメンショナルな戦略転移、構造化されたエラー分類、および因果コンテキストに基づくグラフ検索という 3 つの中核的革新を取り入れた「階層的エラー修正グラフフレームワーク（HECG）」を提案し、自律エージェントが複雑なタスクにおいて戦略の精度を高め、失敗の根本原因を特定して修正し、動的環境での実行信頼性を向上させることを可能にします。

Cong Cao, Jingyao Zhang, Kun Tong2026-03-10💻 cs

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

本論文は、LLM が生成トークンの条件付けによって行動を柔軟に切り替えられる「変幻自在性」を発見し、これを強化学習で定着させるフレームワーク「ToCoRL」を提案することで、推論モデルの能力を維持しつつ事実問答などへの適応を可能にしたことを示しています。

Liyuan Mao, Le Yu, Jing Zhou, Chujie Zheng, Bowen Yu, Chang Gao, Shixuan Liu, An Yang, Weinan Zhang, JunYang Lin2026-03-10🤖 cs.LG

A Recipe for Stable Offline Multi-agent Reinforcement Learning

本論文は、オフライン多エージェント強化学習における非線形価値分解の不安定さを解消し、スケーリング不変な価値正規化（SVN）を導入することで、安定した学習と実用的なレシピを実現する手法を提案しています。

Dongsu Lee, Daehee Lee, Amy Zhang2026-03-10🤖 cs.LG

Aligning to Illusions: Choice Blindness in Human and AI Feedback

この論文は、人間の選好が文脈操作によって容易に書き換えられ、LLM による検出も不十分であり、標準的な評価指標では見逃される「選好の構築問題」が存在し、これが RLHF の報酬信号と最終的な方策の劣化を引き起こすことを示しています。

Wenbin Wu2026-03-10💬 cs.CL

Geometrically Constrained Outlier Synthesis

この論文は、学習データの特徴空間の多様体構造を尊重して仮想外れ値を合成する「幾何学的制約付き外れ値合成（GCOS）」という正則化フレームワークを提案し、既知の分布内データと共有する意味領域における外れ値検出の性能を向上させ、さらに統計的に有効な誤り保証を持つ不確実性スコアへの拡張も可能にするものである。

Daniil Karzanov, Marcin Detyniecki2026-03-10🤖 cs.LG

Human-Aware Robot Behaviour in Self-Driving Labs

この論文は、自己運転実験室における人間とロボットの共有アクセス効率を向上させるため、人間の意図を予測して受動的な待機ではなく能動的な協調を可能にする階層的な AI 駆動知覚手法を提案し、その有効性を示したものである。

Satheeshkumar Veeramani, Anna Kisil, Abigail Bentley, Hatem Fakhruldeen, Gabriella Pizzuto, Andrew I. Cooper2026-03-10💻 cs

SYNAPSE: Framework for Neuron Analysis and Perturbation in Sequence Encoding

本論文は、Transformer モデルの内部挙動を再学習なしで体系的に分析・検証し、表現の冗長性による安定性と構造的な脆弱性の両面を明らかにする新しいフレームワーク「SYNAPSE」を提案しています。

Jesús Sánchez Ochoa, Enrique Tomás Martínez Beltrán, Alberto Huertas Celdrán2026-03-10🤖 cs.LG

IronEngine: Towards General AI Assistant

本論文は、デスクトップ UI、多様な API、ローカルおよびクラウドモデル、持続的メモリ、タスクスケジューリング、MCP 互換性などを統合したユニファイド・オーケストレーションコアを中核とし、計画と実行を分離する 3 フェーズパイプラインや適応的なモデル管理、高度なツールルーティングを備えた汎用 AI アシスタントプラットフォーム「IronEngine」のアーキテクチャ、設計、性能、および他システムとの比較分析を提示するものである。

Xi Mo2026-03-10🤖 cs.LG

One Model Is Enough: Native Retrieval Embeddings from LLM Agent Hidden States

この論文は、LLM の隠れ状態から軽量な投影ヘッドを用いて直接検索埋め込みを生成する手法を提案し、従来の「生成後エンコード」パイプラインを不要にしながらも、QReCC ベンチマークで基線モデルの検索品質の 97% を維持できることを示しています。

Bo Jiang2026-03-10💬 cs.CL

Efficient Policy Learning with Hybrid Evaluation-Based Genetic Programming for Uncertain Agile Earth Observation Satellite Scheduling

本論文は、不確実性を伴うアジャイル地球観測衛星のスケジューリング問題に対し、正確な評価と近似評価を動的に切り替えるハイブリッド評価メカニズムを組み込んだ遺伝的プログラミング超ヒューリスティック（HE-GP）を提案し、計算コストを大幅に削減しながら既存手法を上回る高性能なスケジューリングポリシーを効率的に学習可能であることを示しています。

Junhua Xue, Yuning Chen2026-03-10💻 cs

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

この研究は、リアルタイムの安全監視下で実施された前向き臨床feasibility 研究において、LLM ベースの対話型 AI「AMIE」が、患者の満足度向上や医師の準備性への貢献、そして診断精度において医療従事者と同等の安全性と質を有し、実際のプライマリケア現場での導入可能性を実証したことを示しています。

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam Rodman2026-03-10🤖 cs.LG

← 前へ次へ →

cs.AI

Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

Towards plausibility in time series counterfactual explanations

Computational modeling of early language learning from acoustic speech and audiovisual input without linguistic priors

M $^3$ -ACE: Rectifying Visual Perception in Multimodal Math Reasoning via Multi-Agentic Context Engineering

A Hierarchical Error-Corrective Graph Framework for Autonomous Agents with LLM-Based Action Generation

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

A Recipe for Stable Offline Multi-agent Reinforcement Learning

Aligning to Illusions: Choice Blindness in Human and AI Feedback

Geometrically Constrained Outlier Synthesis

Human-Aware Robot Behaviour in Self-Driving Labs

SYNAPSE: Framework for Neuron Analysis and Perturbation in Sequence Encoding

IronEngine: Towards General AI Assistant

One Model Is Enough: Native Retrieval Embeddings from LLM Agent Hidden States

Efficient Policy Learning with Hybrid Evaluation-Based Genetic Programming for Uncertain Agile Earth Observation Satellite Scheduling

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing

The Boiling Frog Threshold: Criticality and Blindness in World Model-Based Anomaly Detection Under Gradual Drift

R2F: Repurposing Ray Frontiers for LLM-free Object Navigation

X-AVDT: Audio-Visual Cross-Attention for Robust Deepfake Detection

Visual Self-Fulfilling Alignment: Shaping Safety-Oriented Personas via Threat-Related Images

cs.AI

Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

Towards plausibility in time series counterfactual explanations

Computational modeling of early language learning from acoustic speech and audiovisual input without linguistic priors

M3^33-ACE: Rectifying Visual Perception in Multimodal Math Reasoning via Multi-Agentic Context Engineering

A Hierarchical Error-Corrective Graph Framework for Autonomous Agents with LLM-Based Action Generation

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

A Recipe for Stable Offline Multi-agent Reinforcement Learning

Aligning to Illusions: Choice Blindness in Human and AI Feedback

Geometrically Constrained Outlier Synthesis

Human-Aware Robot Behaviour in Self-Driving Labs

SYNAPSE: Framework for Neuron Analysis and Perturbation in Sequence Encoding

IronEngine: Towards General AI Assistant

One Model Is Enough: Native Retrieval Embeddings from LLM Agent Hidden States

Efficient Policy Learning with Hybrid Evaluation-Based Genetic Programming for Uncertain Agile Earth Observation Satellite Scheduling

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing

The Boiling Frog Threshold: Criticality and Blindness in World Model-Based Anomaly Detection Under Gradual Drift

R2F: Repurposing Ray Frontiers for LLM-free Object Navigation

X-AVDT: Audio-Visual Cross-Attention for Robust Deepfake Detection

Visual Self-Fulfilling Alignment: Shaping Safety-Oriented Personas via Threat-Related Images

M $^3$ -ACE: Rectifying Visual Perception in Multimodal Math Reasoning via Multi-Agentic Context Engineering