RbtAct: Rebuttal as Supervision for Actionable Review Feedback Generation

この論文は、査読者のコメントが著者によってどのように修正や反論に結びついたかを示す「反論(rebuttal)」を教師信号として活用し、LLM が具体的かつ実行可能な査読フィードバックを生成するための新しい手法「RbtAct」と大規模データセット「RMR-75K」を提案し、その有効性を示したものである。

Sihong Wu, Yiling Ma, Yilun Zhao, Tiansheng Hu, Owen Jiang, Manasi Patwardhan, Arman CohanWed, 11 Ma🤖 cs.AI

EXPLORE-Bench: Egocentric Scene Prediction with Long-Horizon Reasoning

この論文は、実世界の一人称視点動画から構築された新しいベンチマーク「EXPLORE-Bench」を提案し、マルチモーダル大規模言語モデルが長期的な物理的帰結を推論する能力に依然として大きな課題があることを示すとともに、段階的推論による性能向上の可能性と計算コストのトレードオフを分析しています。

Chengjun Yu, Xuhan Zhu, Chaoqun Du, Pengfei Yu, Wei Zhai, Yang Cao, Zheng-Jun ZhaWed, 11 Ma🤖 cs.AI

Ego: Embedding-Guided Personalization of Vision-Language Models

この論文は、大規模視覚言語モデルの内部アテンション機構から対象概念を主に表す視覚トークンを抽出してメモリとして活用する効率的な手法「Ego」を提案し、追加学習や外部モジュールなしで単一・複数概念および動画の個人化において最先端の性能を達成することを示しています。

Soroush Seifi, Simon Gardier, Vaggelis Dorovatas, Daniel Olmeda Reino, Rahaf AljundiWed, 11 Ma🤖 cs.AI

World2Mind: Cognition Toolkit for Allocentric Spatial Reasoning in Foundation Models

生物の空間認知メカニズムに着想を得たトレーニング不要のツール「World2Mind」は、3D 再構成と楕円パラメータを用いたアロセントリック空間木(AST)の構築により、マルチモーダル基盤モデルの空間推論能力を大幅に向上させ、テキストのみのモデルでも高度な 3D 空間推論を可能にします。

Shouwei Ruan, Bin Wang, Zhenyu Wu, Qihui Zhu, Yuxiang Zhang, Hang Su, Yubin WangWed, 11 Ma🤖 cs.AI

First Estimation of Model Parameters for Neutrino-Induced Nucleon Knockout Using Simulation-Based Inference

本論文は、シミュレーションベース推論(SBI)を用いてニュートリノ事象生成器 GENIE のモデルパラメータを推定する手法を検証し、MicroBooNE 実験データに基づく従来手法と比較してわずかに異なるパラメータ値を導き出し、異なるシミュレーションコード(NuWro)の近似も可能であることを示した。

Karla Tame-Narvaez, Steven Gardiner, Aleksandra Ciprijanovic, Giuseppe CeratiWed, 11 Ma⚛️ hep-ph

Quantifying the Necessity of Chain of Thought through Opaque Serial Depth

この論文は、大規模言語モデルが外部化せずに推論を行う可能性の限界を定量化する新概念「不透明な直列深さ」を提案し、Gemma 3 モデルや MoE 構造などのアーキテクチャに対する数値的上限を計算する自動化手法を開示することで、モデルが外部化されていない推論を行う潜在的な能力を評価する枠組みを提供しています。

Jonah Brown-Cohen, David Lindner, Rohin ShahWed, 11 Ma🤖 cs.AI

Exploiting Label-Aware Channel Scoring for Adaptive Channel Pruning in Split Learning

この論文は、スプリット学習における通信オーバーヘッドを削減するため、ラベル情報を活用してチャネルの重要度を評価し、重要度の低いチャネルを適動的に剪定して中間特徴データを圧縮する「ACP-SL」という新しい手法を提案し、その有効性を示したものです。

Jialei Tan, Zheng Lin, Xiangming Cai, Ruoxi Zhu, Zihan Fang, Pingping Chen, Wei NiWed, 11 Ma🤖 cs.AI

MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents

本論文は、複数の具象化エージェントから同時に収集された長時間の第一人称視点動画を理解する新たな課題を定義し、その評価のためのベンチマーク「MA-EgoQA」と、エージェント間の共有メモリと動的検索を活用するベースラインモデル「EgoMAS」を提案しています。

Kangsan Kim, Yanlai Yang, Suji Kim, Woongyeong Yeo, Youngwan Lee, Mengye Ren, Sung Ju HwangWed, 11 Ma🤖 cs.AI

SCENEBench: An Audio Understanding Benchmark Grounded in Assistive and Industrial Use Cases

この論文は、アクセシビリティ技術や産業用ノイズ監視のニーズに基づき、音声認識を超えた背景音の理解や雑音の局所化など多様な音声理解能力を評価する新しいベンチマーク「SCENEBench」を提案し、最先端の大型音声言語モデルの現状と課題を明らかにしたものである。

Laya Iyer, Angelina Wang, Sanmi KoyejoWed, 11 Ma🤖 cs.AI

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

この論文は、地理空間データを用いてスペクトル需要を予測し、空間的自己相関の問題を解決することで既存モデルより 21% 高い精度を達成する階層型アテンションネットワーク「HR-GAT」を提案し、5 つの主要カナダ都市でその有効性を実証したものである。

Mohamad Alkadamani, Halim Yanikomeroglu, Amir GhasemiWed, 11 Ma🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

本論文は、複雑な環境における接触誘発ダイナミクスを明示的な世界モデルで学習し、これを強化学習に条件付ける「DAPL」フレームワークを提案することで、人手による接触ヒューリスティックや複雑な報酬設計なしに、乱雑な環境下での外因的巧緻性を実現する手法を提示しています。

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He WangWed, 11 Ma🤖 cs.AI

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

この論文は、強化学習を用いずにプロンプトをパラメータ化された「行動」として扱いつつ、エージェントの状態に基づいて動的にプロンプトを構築する軽量な方策フレームワークを提案し、これによりマルチエージェント対話のダイナミクスを効果的に制御できることを示しています。

Hongbo Bo, Jingyu Hu, Weiru LiuWed, 11 Ma🤖 cs.AI

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

この論文は、逐次学習における大規模言語モデルの忘却を抑制しつつ適応性を維持するため、サンプルごとの記憶強度を推定し適応的にリハーサルをスケジュールする新しい経験再生フレームワーク「MSSR」を提案し、広範な実験で最先端の手法を上回る性能を実証したものである。

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan ZhaWed, 11 Ma🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

本論文は、医療マルチエージェントシステムのアーキテクチャ断絶と標準化不足を解決するため、11 の異種アーキテクチャと 24 の医療モダリティを統合し、11 の臓器系・473 の疾患にわたる包括的なベンチマークと自動臨床推論評価機能を提供する統一フレームワーク「MedMASLab」を提案するものである。

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran LiWed, 11 Ma🤖 cs.AI

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

この論文は、ライセンスデータやクラウドソーシングデータなどの複数の代理指標を用いた AI・機械学習アプローチにより、5 つの主要カナダ都市で実測トラフィックデータと高い相関(R²=0.89)を示すスペクトル需要予測モデルを提案し、動的な周波数資源の効率的な配分と政策立案を支援することを目的としています。

Colin Brown, Mohamad Alkadamani, Halim YanikomerogluWed, 11 Ma🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

この論文は、利用可能な画像データと臨床メタデータを動的に統合し、GPT-4o による意味的ガイダンスを取り入れた適応型臨床意識潜在拡散モデル「ACADiff」を提案し、アルツハイマー病診断における多モダリティ脳画像の欠損補完と高品質な合成を実現したことを述べています。

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging InitiativeWed, 11 Ma🤖 cs.AI