cs.AI 件の論文 | Gist.Science

Physics-Informed Neural Engine Sound Modeling with Differentiable Pulse-Train Synthesis

この論文は、エンジンの排気圧力パルスの物理的メカニズムにインダクティブバイアスを組み込んだ微分可能なパルス列合成モデル「PTR」を提案し、従来の調和音モデルと比較して高品質なエンジン音の再構成と物理パラメータの解釈可能性を実現したことを示しています。

Robin Doerfler, Lonce Wyse2026-03-11🤖 cs.AI

ICDAR 2025 Competition on End-to-End Document Image Machine Translation Towards Complex Layouts

ICDAR 2025 における複雑なレイアウトを持つ文書画像の機械翻訳コンペティションは、OCR 不要・OCR 利用の 2 つのトラックで 69 チームが参加し、大規模モデルが複雑な文書画像の翻訳において有望な新たなパラダイムを確立したことを示す結果を報告しています。

Yaping Zhang, Yupu Liang, Zhiyang Zhang, Zhiyuan Chen, Lu Xiang, Yang Zhao, Yu Zhou, Chengqing Zong2026-03-11🤖 cs.AI

Reviving ConvNeXt for Efficient Convolutional Diffusion Models

本論文は、DiT-XL/2 の FLOPs の 50% 未満で同等の性能を達成し、さらに 4 GPU 環境でのトレーニングを可能にする「FCDM」と呼ばれる完全畳み込み拡散モデルを提案し、現代の畳み込み設計が拡散モデルのスケーリングにおいて効率的かつ競争力のある代替手段となり得ることを示しています。

Taesung Kwon, Lorenzo Bianchi, Lennart Wittke, Felix Watine, Fabio Carrara, Jong Chul Ye, Romann Weber, Vinicius Azevedo2026-03-11🤖 cs.AI

PromptDLA: A Domain-aware Prompt Document Layout Analysis Framework with Descriptive Knowledge as a Cue

この論文は、異なるドメインのレイアウト構造やラベル付けスタイルの差異を考慮し、記述知識を手がかりとしてドメイン固有のプロンプトを生成する「PromptDLA」という新しいドメイン認識型プロンプターを提案し、複数の主要なドキュメントレイアウト分析データセットにおいて最先端の性能を達成したことを示しています。

Zirui Zhang, Yaping Zhang, Lu Xiang, Yang Zhao, Feifei Zhai, Yu Zhou, Chengqing Zong2026-03-11🤖 cs.AI

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

この論文は、反復的な積分による遅延を回避しつつ多様な動作分布を単一ステップで保持するよう、条件付きフローマッチングの教師モデルを IMLE ベースの分布蒸留と双方向チャンバー距離を用いて高速な単一ステップ学生モデルへ転移するフレームワークを提案し、リアルタイムの多モーダルロボット制御を実現するものである。

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei Zhang2026-03-11🤖 cs.AI

Investigating Gender Stereotypes in Large Language Models via Social Determinants of Health

本論文は、フランス語の患者記録を用いた実験を通じて、大規模言語モデル（LLM）が性別と他の社会的決定要因（SDoH）の相互作用に基づいてステレオタイプに依存した判断を下すことを実証し、既存のバイアス評価手法を補完する新たなアプローチの必要性を提唱しています。

Trung Hieu Ngo, Adrien Bazoge, Solen Quiniou, Pierre-Antoine Gourraud, Emmanuel Morin2026-03-11🤖 cs.AI

Open-World Motion Forecasting

この論文は、認識の不完全さや物体カテゴリの時間的変化といった現実世界の課題に対処するため、新しい物体クラスが逐次導入される「オープンワールド運動予測」という新たな設定を提案し、擬似ラベリングと視覚言語モデル、そしてクエリ特徴量分散に基づくリプレイサンプリングを組み合わせたエンドツーエンドのクラス増分学習フレームワークを構築し、忘却を抑制しつつ新規クラスへの適応とゼロショット転送を実現したことを示しています。

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav Valada2026-03-11🤖 cs.AI

CERES: A Probabilistic Early Warning System for Acute Food Insecurity

この論文は、気象・植生・紛争・価格など 6 つのデータストリームを統合し、43 か国の急性食料不安に対する 90 日後の確率予測を毎週生成するとともに、すべての予測を公開検証可能な形で記録する、初の確率的かつオープンアクセスの早期警戒システム「CERES」を提案するものです。

Tom Danny S. Pedersen2026-03-11🤖 cs.AI

Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs

この論文は、大規模言語モデルが道徳的推論を常識的理解よりも優先する傾向にあること、特に物語の語り手ではなく二次的な登場人物に矛盾が割り当てられた場合にのみその矛盾を検出しやすい「物語焦点バイアス」が存在することを、新規ベンチマーク「CoMoral」を用いた評価を通じて明らかにし、常識の堅牢性を高めるための推論重視のトレーニングの必要性を訴えています。

Saugata Purkayastha, Pranav Kushare, Pragya Paramita Pal, Sukannya Purkayastha2026-03-11🤖 cs.AI

AI Act Evaluation Benchmark: An Open, Transparent, and Reproducible Evaluation Dataset for NLP and RAG Systems

この論文は、EU 人工知能法への準拠評価を支援するため、大規模言語モデルとドメイン知識を組み合わせることで作成された、リスク分類や義務生成などのタスクを含むオープンで再現性の高いデータセットと評価手法を提案するものです。

Athanasios Davvetas, Michael Papademas, Xenia Ziouvelou, Vangelis Karkaletsis2026-03-11🤖 cs.AI

A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation

この論文は、臨床ガイドラインの更新に柔軟に対応し、再学習なしでゼロショットで放射線治療の標的体積を自動描画する新しい AI エージェント「OncoAgent」を提案し、その性能が教師ありモデルと同等でありながら医師からの評価も高いことを示しています。

Yoon Jo Kim, Wonyoung Cho, Jongmin Lee, Han Joo Chae, Hyunki Park, Sang Hoon Seo, Noh Jae Myung, Kyungmi Yang, Dongryul Oh, Jin Sung Kim2026-03-11🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

この論文は、大規模な基礎モデルにおける不確実性の定量化と計算コストの両立を実現するため、混合専門家（MoE）層のルーティング段階にベイズ推論を限定した「変分混合専門家ルーティング（VMoER）」を提案し、較正誤差の大幅な削減と分布外データに対する性能向上を、計算コストの増加を最小限に抑えながら達成することを示しています。

Albus Yizhuo Li, Matthew Wicker2026-03-11🤖 cs.AI

Declarative Scenario-based Testing with RoadLogic

本論文は、自律走行車のシナリオベーステストにおいて、宣言的な OpenSCENARIO 仕様を実行可能なシミュレーションに変換し、多様な行動バリエーションを体系的に生成するオープンソースツール「RoadLogic」を提案し、その有効性を示すものである。

Ezio Bartocci, Alessio Gambi, Felix Gigler, Cristinel Mateis, Dejan Ničkovic2026-03-11🤖 cs.AI

An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse

本論文は、異なるタスクに特化したモデルを結合する際に生じる「結合崩壊」現象を特定し、パラメータ空間の競合ではなく表現の非互換性がその主因であることを実証的に示すとともに、レート歪み理論を用いてタスクの結合可能性に本質的な限界があることを理論的に説明するものである。

Yuan Cao, Dezhi Ran, Yuzhe Guo, Mengzhou Wu, Simin Chen, Linyi Li, Wei Yang, Tao Xie2026-03-11🤖 cs.AI

EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

本論文は、視覚エンコーダの解凍による知覚性能の低下と長期計画における不安定性という課題を解決するため、自己アンカー型知覚制約とオラクル指導軌道最適化を統合した新しい協調的知覚・計画蒸留フレームワーク「EvoDriveVLA」を提案し、オープンループおよびクローズドループ評価の両方で最先端の性能を達成したことを報告しています。

Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Wang Zijian, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou Liu, Yang Wang, Shanghang Zhang2026-03-11🤖 cs.AI

Telogenesis: Goal Is All U Need

この論文は、外部の報酬に依存せず、無知・驚き・陳腐化という3つの認知的ギャップから優先度を内生的に生成する「Telogenesis」を提案し、これが固定戦略を上回る適応性を示すだけでなく、環境の隠れた変動構造を教師なしで回復できることを実証しています。

Zhuoran Deng, Yizhi Zhang, Ziyi Zhang, Wan Shen2026-03-11🤖 cs.AI

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

この論文は、大規模言語モデルを活用した進化アルゴリズムを用いて PDDL で記述された古典的計画タスク向けの汎用的なプランナーを自動生成する「GenePlan」という新しいフレームワークを提案し、既存の最先端プランナーと同等の性能を発揮しながら、他の LLM ベースの手法を大幅に上回る結果を示したことを報告しています。

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael Cashmore2026-03-11🤖 cs.AI

Vibe-Creation: The Epistemology of Human-AI Emergent Cognition

本論文は、人間と生成 AI の相互作用が「ツール」や「協働」を超えた「第三の存在」としての新たな認知・認識論的形態を生み出し、その非反射的な「雰囲気創造（vibe-creation）」と非対称的創発の概念を通じて、教育や知の再定義を迫る理論的枠組みを提示している。

Ilya Levin2026-03-11🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

この論文は、過去の観測値に基づいて正常な時系列データの確率分布を正確にモデル化し、低確率事象を検出することで多変量時系列の異常検知を可能にする「時系列条件付き正規化フロー（tcNF）」という新しい枠組みを提案し、その有効性を検証したものである。

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri Ramampiaro2026-03-11🤖 cs.AI

Evolving Prompt Adaptation for Vision-Language Models

本論文は、事前学習されたビジョン・言語モデルの知識を維持しつつ少量データで効果的に適応させるため、プロンプトの進化経路を明示的に制御し、方向性を保持しながら更新を行う「EvoPrompt」という新しいフレームワークを提案するものである。

Enming Zhang, Jiayang Li, Yanru Wu, Zhenyu Liu, Yang Li2026-03-11🤖 cs.AI

← 前へ次へ →