cs.AI 件の論文 | Gist.Science

The Boiling Frog Threshold: Criticality and Blindness in World Model-Based Anomaly Detection Under Gradual Drift

この論文は、強化学習エージェントが世界モデルに基づく自己監視を行う際、観測の漸進的なドリフトに対して検知閾値が普遍的存在し、その検知能力がノイズフロア、検出器、環境ダイナミクスという 3 者の相互作用によって決定されることを実証的に明らかにし、特に脆弱な環境ではエージェントが検知前に崩壊する「無自覚な破綻」モードが存在することを示しています。

Zhe Hong2026-03-10🤖 cs.LG

R2F: Repurposing Ray Frontiers for LLM-free Object Navigation

本論文は、推論時の遅延や計算コストを削減しつつリアルタイム性を確保するため、大規模言語モデル（LLM）や視覚言語モデル（VLM）に依存せず、レイフロントを意味的仮説として再解釈した「R2F」という新しい室内オープンボキャブラリー物体ナビゲーションフレームワークを提案し、実機実験で既存の VLM ベース手法より最大 6 倍高速な実行を実現したことを報告しています。

Francesco Argenziano, John Mark Alexis Marcelo, Michele Brienza, Abdel Hakim Drid, Emanuele Musumeci, Daniele Nardi, Domenico D. Bloisi, Vincenzo Suriani2026-03-10💻 cs

X-AVDT: Audio-Visual Cross-Attention for Robust Deepfake Detection

本論文は、生成モデル内部の音声・映像クロスアテンション機構が持つ微細な整合性情報を DDIM 逆変換を通じて抽出する「X-AVDT」という堅牢なディープフェイク検出器と、多様な生成手法を網羅する新たなデータセット「MMDF」を提案し、既存手法を大幅に上回る汎化性能を実証したものである。

Youngseo Kim, Kwan Yun, Seokhyeon Hong, Sihun Cha, Colette Suhjung Koo, Junyong Noh2026-03-10🤖 cs.LG

Visual Self-Fulfilling Alignment: Shaping Safety-Oriented Personas via Threat-Related Images

この論文は、安全ラベルを必要とせず、脅威に関連する画像を用いた中立な VQA タスクへの微調整を通じて、視覚的入力に対する有害な出力を抑制し、安全性に配慮したモデルの振る舞いを誘発する「視覚的自己実現型アライメント（VSFA）」という新たな手法を提案し、その有効性を検証したものである。

Qishun Yang, Shu Yang, Lijie Hu, Di Wang2026-03-10💻 cs

First-Order Geometry, Spectral Compression, and Structural Compatibility under Bounded Computation

この論文は、自己共役作用素によって制約を符号化する作用素論的定式化を通じて、最適化における勾配射影、スペクトル截断、および多目的適合性を単一の幾何学的構造として統合する枠組みを提案しています。

Changkai Li2026-03-10🔢 math

Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos

本論文は、単一ビューの心エコー図に依存する既存手法の限界を克服し、多視点心エコー図から得られる心臓の形態構造をECG表現に統合するマルチモーダル自己教師あり学習フレームワーク「Echo2ECG」を提案し、構造的な心臓表現の分類や類似心エコー図の検索といった臨床タスクにおいて、従来手法を凌駕する高性能かつ軽量なECG特徴量抽出器を実現したことを報告しています。

Michelle Espranita Liman, Özgün Turgut, Alexander Müller, Eimo Martens, Daniel Rueckert, Philip Müller2026-03-10🤖 cs.LG

Oracle-Guided Soft Shielding for Safe Move Prediction in Chess

この論文は、チェスにおいて方策モデルとブランダ（悪手）予測モデルを組み合わせ、オラクルのフィードバックに基づく確率的な安全モデル（OGSS）を導入することで、探索性を高めつつ戦術的なミスを大幅に削減する安全な意思決定フレームワークを提案しています。

Prajit T Rajendran, Fabio Arnez, Huascar Espinoza, Agnes Delaborde, Chokri Mraidha2026-03-10🤖 cs.LG

Towards Effective and Efficient Graph Alignment without Supervision

この論文は、教師なしグラフアライメントにおいて、局所情報と大域情報のミスマッチを解消し、最適輸送の計算複雑度を立方から二次に削減しながら精度と効率を大幅に向上させる新たな手法「GlobAlign」およびその高速版「GlobAlign-E」を提案するものです。

Songyang Chen, Youfang Lin, Yu Liu, Shuai Zheng, Lei Zou2026-03-10🤖 cs.LG

RetroAgent: From Solving to Evolving via Retrospective Dual Intrinsic Feedback

この論文は、LLM ベースのエージェントが複雑な対話タスクにおいて単に問題を解決するだけでなく、 hindsight による自己反省と二重の内在的フィードバック（数値的フィードバックと再利用可能な教訓を記憶する言語フィードバック）を活用して継続的に進化・適応することを可能にする強化学習フレームワーク「RetroAgent」を提案し、複数のタスクで既存手法を大幅に上回る性能を示したことを報告しています。

Xiaoying Zhang, Zichen Liu, Yipeng Zhang, Xia Hu, Wenqi Shao2026-03-10💻 cs

OSS-CRS: Liberating AIxCC Cyber Reasoning Systems for Real-World Open-Source Security

DARPA の AI サイバーチャレンジで開発されたが実用化が難しかった自律型サイバー推論システム（CRS）を、OSS-CRS というオープンソースのローカル展開可能フレームワークに統合・実装し、実世界のオープンソースプロジェクトに対して 10 件の未発見バグ（うち 3 件が重要度大）を発見・修正できることを実証した。

Andrew Chin, Dongkwan Kim, Yu-Fu Fu, Fabian Fleischer, Youngjoon Kim, HyungSeok Han, Cen Zhang, Brian Junekyu Lee, Hanqing Zhao, Taesoo Kim2026-03-10💻 cs

Trust via Reputation of Conviction

この論文は、知識・真実・信頼を数学的に定式化し、正しさや忠実さではなく独立した合意によって裏付けられる「確信」を信頼の基礎とし、AI エージェントを含む情報源の信頼性を評価するための評判の枠組みを構築することを提案しています。

Aravind R. Iyengar2026-03-10🤖 cs.LG

Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control

本論文は、リソース制約のある環境や Sim2Real 転送などのオンデバイス微調整に適応できるよう、バッチ学習と同等の性能を維持しつつリプレイバッファやターゲットネットワークを不要とする「Streaming Soft Actor-Critic (S2AC)」および「Streaming Deterministic Actor-Critic (SDAC)」という 2 つの新しいストリーミング深層強化学習アルゴリズムを提案し、バッチからストリーミングへの移行における実用的な課題とその解決策を調査したものである。

Riccardo De Monte, Matteo Cederle, Gian Antonio Susto2026-03-10🤖 cs.LG

← 前へ次へ →

cs.AI

The Boiling Frog Threshold: Criticality and Blindness in World Model-Based Anomaly Detection Under Gradual Drift

R2F: Repurposing Ray Frontiers for LLM-free Object Navigation

X-AVDT: Audio-Visual Cross-Attention for Robust Deepfake Detection

Visual Self-Fulfilling Alignment: Shaping Safety-Oriented Personas via Threat-Related Images

First-Order Geometry, Spectral Compression, and Structural Compatibility under Bounded Computation

Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos

Oracle-Guided Soft Shielding for Safe Move Prediction in Chess

Towards Effective and Efficient Graph Alignment without Supervision

RetroAgent: From Solving to Evolving via Retrospective Dual Intrinsic Feedback

OSS-CRS: Liberating AIxCC Cyber Reasoning Systems for Real-World Open-Source Security

Trust via Reputation of Conviction

Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control

Don't Look Back in Anger: MAGIC Net for Streaming Continual Learning with Temporal Dependence

Weakly Supervised Teacher-Student Framework with Progressive Pseudo-mask Refinement for Gland Segmentation

PostTrainBench: Can LLM Agents Automate LLM Post-Training?

OfficeQA Pro: An Enterprise Benchmark for End-to-End Grounded Reasoning

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

Agentic Critical Training