PromptDLA: A Domain-aware Prompt Document Layout Analysis Framework with Descriptive Knowledge as a Cue

この論文は、異なるドメインのレイアウト構造やラベル付けスタイルの差異を考慮し、記述知識を手がかりとしてドメイン固有のプロンプトを生成する「PromptDLA」という新しいドメイン認識型プロンプターを提案し、複数の主要なドキュメントレイアウト分析データセットにおいて最先端の性能を達成したことを示しています。

Zirui Zhang, Yaping Zhang, Lu Xiang, Yang Zhao, Feifei Zhai, Yu Zhou, Chengqing ZongWed, 11 Ma🤖 cs.AI

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

この論文は、反復的な積分による遅延を回避しつつ多様な動作分布を単一ステップで保持するよう、条件付きフローマッチングの教師モデルを IMLE ベースの分布蒸留と双方向チャンバー距離を用いて高速な単一ステップ学生モデルへ転移するフレームワークを提案し、リアルタイムの多モーダルロボット制御を実現するものである。

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Investigating Gender Stereotypes in Large Language Models via Social Determinants of Health

本論文は、フランス語の患者記録を用いた実験を通じて、大規模言語モデル(LLM)が性別と他の社会的決定要因(SDoH)の相互作用に基づいてステレオタイプに依存した判断を下すことを実証し、既存のバイアス評価手法を補完する新たなアプローチの必要性を提唱しています。

Trung Hieu Ngo, Adrien Bazoge, Solen Quiniou, Pierre-Antoine Gourraud, Emmanuel MorinWed, 11 Ma🤖 cs.AI

Open-World Motion Forecasting

この論文は、認識の不完全さや物体カテゴリの時間的変化といった現実世界の課題に対処するため、新しい物体クラスが逐次導入される「オープンワールド運動予測」という新たな設定を提案し、擬似ラベリングと視覚言語モデル、そしてクエリ特徴量分散に基づくリプレイサンプリングを組み合わせたエンドツーエンドのクラス増分学習フレームワークを構築し、忘却を抑制しつつ新規クラスへの適応とゼロショット転送を実現したことを示しています。

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav ValadaWed, 11 Ma🤖 cs.AI

Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs

この論文は、大規模言語モデルが道徳的推論を常識的理解よりも優先する傾向にあること、特に物語の語り手ではなく二次的な登場人物に矛盾が割り当てられた場合にのみその矛盾を検出しやすい「物語焦点バイアス」が存在することを、新規ベンチマーク「CoMoral」を用いた評価を通じて明らかにし、常識の堅牢性を高めるための推論重視のトレーニングの必要性を訴えています。

Saugata Purkayastha, Pranav Kushare, Pragya Paramita Pal, Sukannya PurkayasthaWed, 11 Ma🤖 cs.AI

AI Act Evaluation Benchmark: An Open, Transparent, and Reproducible Evaluation Dataset for NLP and RAG Systems

この論文は、EU 人工知能法への準拠評価を支援するため、大規模言語モデルとドメイン知識を組み合わせることで作成された、リスク分類や義務生成などのタスクを含むオープンで再現性の高いデータセットと評価手法を提案するものです。

Athanasios Davvetas, Michael Papademas, Xenia Ziouvelou, Vangelis KarkaletsisWed, 11 Ma🤖 cs.AI

A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation

この論文は、臨床ガイドラインの更新に柔軟に対応し、再学習なしでゼロショットで放射線治療の標的体積を自動描画する新しい AI エージェント「OncoAgent」を提案し、その性能が教師ありモデルと同等でありながら医師からの評価も高いことを示しています。

Yoon Jo Kim, Wonyoung Cho, Jongmin Lee, Han Joo Chae, Hyunki Park, Sang Hoon Seo, Noh Jae Myung, Kyungmi Yang, Dongryul Oh, Jin Sung KimWed, 11 Ma🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

この論文は、大規模な基礎モデルにおける不確実性の定量化と計算コストの両立を実現するため、混合専門家(MoE)層のルーティング段階にベイズ推論を限定した「変分混合専門家ルーティング(VMoER)」を提案し、較正誤差の大幅な削減と分布外データに対する性能向上を、計算コストの増加を最小限に抑えながら達成することを示しています。

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse

本論文は、異なるタスクに特化したモデルを結合する際に生じる「結合崩壊」現象を特定し、パラメータ空間の競合ではなく表現の非互換性がその主因であることを実証的に示すとともに、レート歪み理論を用いてタスクの結合可能性に本質的な限界があることを理論的に説明するものである。

Yuan Cao, Dezhi Ran, Yuzhe Guo, Mengzhou Wu, Simin Chen, Linyi Li, Wei Yang, Tao XieWed, 11 Ma🤖 cs.AI

EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

本論文は、視覚エンコーダの解凍による知覚性能の低下と長期計画における不安定性という課題を解決するため、自己アンカー型知覚制約とオラクル指導軌道最適化を統合した新しい協調的知覚・計画蒸留フレームワーク「EvoDriveVLA」を提案し、オープンループおよびクローズドループ評価の両方で最先端の性能を達成したことを報告しています。

Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Wang Zijian, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou Liu, Yang Wang, Shanghang ZhangWed, 11 Ma🤖 cs.AI

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

この論文は、大規模言語モデルを活用した進化アルゴリズムを用いて PDDL で記述された古典的計画タスク向けの汎用的なプランナーを自動生成する「GenePlan」という新しいフレームワークを提案し、既存の最先端プランナーと同等の性能を発揮しながら、他の LLM ベースの手法を大幅に上回る結果を示したことを報告しています。

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael CashmoreWed, 11 Ma🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

この論文は、過去の観測値に基づいて正常な時系列データの確率分布を正確にモデル化し、低確率事象を検出することで多変量時系列の異常検知を可能にする「時系列条件付き正規化フロー(tcNF)」という新しい枠組みを提案し、その有効性を検証したものである。

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri RamampiaroWed, 11 Ma🤖 cs.AI

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

本論文は、特定ドメインでファインチューニングされたターゲットモデルに対するスペキュレイティブデコーディングの性能低下を、パラメータとデータの両面で効率的にドラフトモデルを適応させる新フレームワーク「EDA」により解決し、再学習コストを大幅に削減しながら平均受入長を向上させることを提案しています。

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong JiWed, 11 Ma🤖 cs.AI

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

この論文は、ビッグファイブの性格特性に基づいて大規模言語モデル(LLM)にパーソナライズされたデマ訂正メッセージを生成させる手法を提案し、同様に性格特性をシミュレートした別の LLM を評価者として用いることで、パーソナライズされたメッセージが一般のメッセージよりも説得力が高いことを実証するとともに、その技術的有用性と倫理的課題を明らかにしています。

Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. PassaroWed, 11 Ma🤖 cs.AI

Compiler-First State Space Duality and Portable O(1)O(1) Autoregressive Caching for Inference

本論文は、Mamba-2 の状態空間双対性アルゴリズムを XLA の最適化パスに直接マッピングすることで、CUDA 固有のカーネルに依存せず CPU、NVIDIA GPU、Google Cloud TPU 単一ソースから実行可能なポータブルかつ O(1)O(1) のオートレグレイシブキャッシングを実現し、TPU 上で高い性能と精度を確認したことを報告しています。

Cosmo SantoniWed, 11 Ma🤖 cs.AI