Gradient Flow Drifting: Generative Modeling via Wasserstein Gradient Flows of KDE-Approximated Divergences

この論文は、カーネル密度推定に基づく発散のワッサーシュタイン勾配流として「Drifting Model」を数学的に定式化し、モード崩壊とモードのぼやけを同時に回避する混合発散戦略や多様体への拡張を含む新しい生成モデルの枠組み「Gradient Flow Drifting」を提案し、その理論的根拠と有効性を示しています。

Jiarui Cao, Zixuan Wei, Yuxin Liu2026-03-12🤖 cs.LG

Recover to Predict: Progressive Retrospective Learning for Variable-Length Trajectory Prediction

この論文は、不完全な観測データから完全な軌跡特徴を段階的に復元・学習する「プログレッシブ・リトロスペクティブ・フレームワーク(PRF)」を提案し、変長軌跡予測の課題を解決するとともに、Argoverse データセットでの実験によりその有効性を実証したものです。

Hao Zhou, Lu Qi, Jason Li, Jie Zhang, Yi Liu, Xu Yang, Mingyu Fan, Fei Luo2026-03-12🤖 cs.AI

Reinforcement Learning with Conditional Expectation Reward

この論文は、数学や一般分野など多様な推論タスクにおいて、手動で設計された検証ルールに依存せず、大規模言語モデル自体を暗黙の検証器として利用し、生成された回答の条件付き期待尤度を報酬信号とする「条件付き期待報酬(CER)」を提案し、自由形式の回答にも柔軟に対応できる汎用的な強化学習手法を確立したことを示しています。

Changyi Xiao, Caijun Xu, Yixin Cao2026-03-12🤖 cs.LG

Detecting and Eliminating Neural Network Backdoors Through Active Paths with Application to Intrusion Detection

この論文は、ニューラルネットワーク内の「アクティブパス」に基づいた新規かつ説明可能な手法を提案し、侵入検知システムにおける機械学習モデルのバックドアトリガーを検出・除去する有効性を示す実験結果を報告しています。

Eirik Høyheim, Magnus Wiik Eckhoff, Gudmund Grov, Robert Flood, David Aspinall2026-03-12🤖 cs.AI

Interleaving Scheduling and Motion Planning with Incremental Learning of Symbolic Space-Time Motion Abstractions

この論文は、タスクとモーションプランニングを統合し、モーションプランナから得られる記号的なフィードバックを用いてスケジューラを反復的に学習させることで、共有作業空間における複数オブジェクトのナビゲーション問題を解決する新規フレームワークを提案し、その有効性を検証したものである。

Elisa Tosello, Arthur Bit-Monnot, Davide Lusuardi, Alessandro Valentini, Andrea Micheli2026-03-12🤖 cs.AI

Are Video Reasoning Models Ready to Go Outside?

この論文は、現実世界の摂動下で視覚言語モデルの推論能力が低下する課題に対処するため、適応的な難易度制御と頑健性意識の一貫性報酬を用いたトレーニングフレームワーク「ROVA」と、実世界摂動を注入した新しいベンチマーク「PVRBench」を提案し、既存モデルの性能を大幅に向上させることを示しています。

Yangfan He, Changgyu Boo, Jaehong Yoon2026-03-12🤖 cs.AI

Emulating Clinician Cognition via Self-Evolving Deep Clinical Research

臨床診断の複雑な認知プロセスを模倣し、対話的な深層臨床研究ワークフローを通じて検査を自律的に要請し経験を学習資産として外部化することで、診断精度を大幅に向上させつつ責任ある継続的進化を実現する「DxEvolve」という自己進化型診断エージェントが開発されました。

Ruiyang Ren, Yuhao Wang, Yunsen Liang, Lan Luo, Jing Liu, Haifeng Wang, Cong Feng, Yinan Zhang, Chunyan Miao, Ji-Rong Wen, Wayne Xin Zhao2026-03-12🤖 cs.AI

A Platform-Agnostic Multimodal Digital Human Modelling Framework: Neurophysiological Sensing in Game-Based Interaction

本論文は、OpenBCI Galea ヘッドセットと SuperTux を活用し、AI モデルや行動推論を埋め込まずに生体信号とインタラクションを構造化された観測データとして分離・表現することで、再現性と拡張性に優れたプラットフォーム非依存のデジタルヒューマンモデリングフレームワークを提案するものである。

Daniel J. Buxton, Mufti Mahmud, Jordan J. Bird, Thomas Hughes-Roberts, David J. Brown2026-03-12🤖 cs.AI

Repurposing Backdoors for Good: Ephemeral Intrinsic Proofs for Verifiable Aggregation in Cross-silo Federated Learning

この論文は、クロスシルオ連合学習における集約の完全性を保証するため、暗号学的証明に代わりモデルパラメータに埋め込まれた「本質的証明(Intrinsic Proofs)」を利用し、バックドア注入と忘却現象を巧みに組み合わせて、軽量かつ高速な検証可能な集約アーキテクチャを提案するものである。

Xian Qin, Xue Yang, Xiaohu Tang2026-03-12🤖 cs.AI

RandMark: On Random Watermarking of Visual Foundation Models

本論文では、視覚基盤モデルの所有権検証を目的として、保持用データセットの内部表現にランダムなデジタル透かしを埋め込むエンコーダ・デコーダネットワークを提案し、理論的および実験的に、透かしが埋め込まれたモデルとそうでないモデルを高い精度で識別できることを示しています。

Anna Chistyakova, Mikhail Pautov2026-03-12🤖 cs.AI

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

本論文は、データベーススキーマの進化がテキストから SQL への変換モデルの性能に与える影響を評価・改善するための包括的なベンチマーク「EvoSchema」を提案し、スキーマ変更の多様なタイプをシミュレートすることでモデルの堅牢性を向上させる道筋を示しています。

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

AlphaFlowTSE: One-Step Generative Target Speaker Extraction via Conditional AlphaFlow

本論文は、混合音声から参照発話を用いて目標話者を抽出するタスクにおいて、従来の多ステップサンプリングの遅延や不安定な混合比予測を回避し、ヤコビアン・ベクトル積不要の条件付き AlphaFlow 手法を用いた単一ステップ生成モデル「AlphaFlowTSE」を提案し、話者類似性と ASR 性能の向上を実証したものである。

Duojia Li, Shuhan Zhang, Zihan Qian, Wenxuan Wu, Shuai Wang, Qingyang Hong, Lin Li, Haizhou Li2026-03-12🤖 cs.AI

UAV traffic scene understanding: A cross-spectral guided approach and a unified benchmark

この論文は、悪天候や夜間などの過酷な環境下でも UAV による交通シーン理解を可能にするために、交通規制知識を視覚表現に統合する「CTCNet」という新しいネットワークと、光学・熱赤外画像の相補性を活用するモジュールを提案し、さらに大規模なマルチモーダルデータセット「Traffic-VQA」を構築して、既存の手法を大幅に上回る性能を実証したものです。

Yu Zhang, Zhicheng Zhao, Ze Luo, Chenglong Li, Jin Tang2026-03-12🤖 cs.AI

Towards Robust Speech Deepfake Detection via Human-Inspired Reasoning

本論文は、大規模音声言語モデルと人間が注釈したデータセットから導き出された推論を組み合わせた新たな音声ディープフェイク検出フレームワーク「HIR-SDD」を提案し、既存手法が抱える汎化性の欠如と解釈性の低さを解決するとともに、予測の根拠を人間が理解可能な形で提示することを可能にします。

Artem Dvirniak, Evgeny Kushnir, Dmitrii Tarasov, Artem Iudin, Oleg Kiriukhin, Mikhail Pautov, Dmitrii Korzh, Oleg Y. Rogov2026-03-12🤖 cs.AI

CUPID: A Plug-in Framework for Joint Aleatoric and Epistemic Uncertainty Estimation with a Single Model

既存の深層学習モデルを再学習させることなく、任意の層にプラグインとして挿入可能な汎用モジュール「CUPID」を提案し、単一のモデルで確率的(Aleatoric)および認識論的(Epistemic)な不確実性を同時に推定し、その発生源を層ごとに解釈可能にする手法を提示しています。

Xinran Xu, Xiuyi Fan2026-03-12🤖 cs.LG