cs.AI 件の論文 | Gist.Science

D-GAP: Improving Out-of-Domain Robustness via Dataset-Agnostic and Gradient-Guided Augmentation in Frequency and Pixel Spaces

本論文は、周波数空間とピクセル空間の両方で勾配に基づいた適応的データ拡張を行う「D-GAP」を提案し、ドメインシフトに対する汎化性能を大幅に向上させる手法を提示しています。

Ruoqi Wang, Haitao Wang, Shaojie Guo, Qiong Luo2026-03-12🤖 cs.AI

STREAM-VAE: Dual-Path Routing for Slow and Fast Dynamics in Vehicle Telemetry Anomaly Detection

本論文は、自動車テレメトリデータに見られる「緩やかなドリフト」と「急激なスパイク」という異なる時間スケールの動的特性を、双経路エンコーダとデコーダを用いて明示的に分離することで、既存手法よりも頑健な異常検知を実現する「STREAM-VAE」を提案しています。

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

REMSA: Foundation Model Selection for Remote Sensing via a Constraint-Aware Agent

遠隔 sensing 分野において、散在するドキュメントや複雑な制約条件による基盤モデルの選定課題を解決するため、160 以上のモデルを網羅する構造化データベース「RS-FMD」を構築し、自然言語クエリから制約条件を考慮して最適なモデルを自動選定・説明するエージェント「REMSA」を提案し、専門家の評価によるベンチマークでその有効性を実証した論文です。

Binger Chen, Tacettin Emre Bök, Behnood Rasti, Volker Markl, Begüm Demir2026-03-12🤖 cs.AI

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

本論文は、医療データにおけるプライバシー漏洩リスクに対処するため、医療概念の階層構造と幾何学的制約を統合し、特定知識の効率的な忘却と汎用医療能力の維持を両立させる階層的二重戦略のアンラーニング手法を提案し、MedMCQA や MHQA などのデータセットで高い忘却率と知識保持率を達成したことを示しています。

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

この論文は、SEC 提出書類や傷害報告などの業界標準データを Isaac Sim の物理シミュレーションと統合し、タスク成功だけでなく実世界の経済的採算性を評価する初の物理ベースのベンチマーク「CostNav」を提案し、既存の 7 つのナビゲーション手法がいずれも経済的に成立していないことを示しています。

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

← 前へ次へ →

cs.AI

D-GAP: Improving Out-of-Domain Robustness via Dataset-Agnostic and Gradient-Guided Augmentation in Frequency and Pixel Spaces

STREAM-VAE: Dual-Path Routing for Slow and Fast Dynamics in Vehicle Telemetry Anomaly Detection

REMSA: Foundation Model Selection for Remote Sensing via a Constraint-Aware Agent

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

IndiMathBench: Autoformalizing Mathematical Reasoning Problems with a Human Touch

World Models That Know When They Don't Know - Controllable Video Generation with Calibrated Uncertainty

Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

Maximum Risk Minimization with Random Forests

GTR-Turbo: Merged Checkpoint is Secretly a Free Teacher for Agentic VLM Training

Pretrained battery transformer (PBT): A foundation model for universal battery life prediction

Enhancing Tree Species Classification: Insights from YOLOv8 and Explainable AI Applied to TLS Point Cloud Projections

The Bayesian Geometry of Transformer Attention

Gradient Dynamics of Attention: How Cross-Entropy Sculpts Bayesian Manifolds

Geometric Scaling of Bayesian Inference in LLMs

Over-Searching in Search-Augmented Large Language Models

Burn-After-Use for Preventing Data Leakage through a Secure Multi-Tenant Architecture in Enterprise LLM

Beyond Max Tokens: Stealthy Resource Amplification via Tool Calling Chains in LLM Agents

Learning Transferable Skills in Action RPGs via Directed Skill Graphs and Selective Adaptation

MemOCR: Layout-Aware Visual Memory for Efficient Long-Horizon Reasoning