Physics-Informed Neural Engine Sound Modeling with Differentiable Pulse-Train Synthesis
この論文は、エンジンの排気圧力パルスの物理的メカニズムにインダクティブバイアスを組み込んだ微分可能なパルス列合成モデル「PTR」を提案し、従来の調和音モデルと比較して高品質なエンジン音の再構成と物理パラメータの解釈可能性を実現したことを示しています。
5163 件の論文
この論文は、エンジンの排気圧力パルスの物理的メカニズムにインダクティブバイアスを組み込んだ微分可能なパルス列合成モデル「PTR」を提案し、従来の調和音モデルと比較して高品質なエンジン音の再構成と物理パラメータの解釈可能性を実現したことを示しています。
ICDAR 2025 における複雑なレイアウトを持つ文書画像の機械翻訳コンペティションは、OCR 不要・OCR 利用の 2 つのトラックで 69 チームが参加し、大規模モデルが複雑な文書画像の翻訳において有望な新たなパラダイムを確立したことを示す結果を報告しています。
本論文は、DiT-XL/2 の FLOPs の 50% 未満で同等の性能を達成し、さらに 4 GPU 環境でのトレーニングを可能にする「FCDM」と呼ばれる完全畳み込み拡散モデルを提案し、現代の畳み込み設計が拡散モデルのスケーリングにおいて効率的かつ競争力のある代替手段となり得ることを示しています。
この論文は、異なるドメインのレイアウト構造やラベル付けスタイルの差異を考慮し、記述知識を手がかりとしてドメイン固有のプロンプトを生成する「PromptDLA」という新しいドメイン認識型プロンプターを提案し、複数の主要なドキュメントレイアウト分析データセットにおいて最先端の性能を達成したことを示しています。
この論文は、反復的な積分による遅延を回避しつつ多様な動作分布を単一ステップで保持するよう、条件付きフローマッチングの教師モデルを IMLE ベースの分布蒸留と双方向チャンバー距離を用いて高速な単一ステップ学生モデルへ転移するフレームワークを提案し、リアルタイムの多モーダルロボット制御を実現するものである。
本論文は、フランス語の患者記録を用いた実験を通じて、大規模言語モデル(LLM)が性別と他の社会的決定要因(SDoH)の相互作用に基づいてステレオタイプに依存した判断を下すことを実証し、既存のバイアス評価手法を補完する新たなアプローチの必要性を提唱しています。
この論文は、認識の不完全さや物体カテゴリの時間的変化といった現実世界の課題に対処するため、新しい物体クラスが逐次導入される「オープンワールド運動予測」という新たな設定を提案し、擬似ラベリングと視覚言語モデル、そしてクエリ特徴量分散に基づくリプレイサンプリングを組み合わせたエンドツーエンドのクラス増分学習フレームワークを構築し、忘却を抑制しつつ新規クラスへの適応とゼロショット転送を実現したことを示しています。
この論文は、気象・植生・紛争・価格など 6 つのデータストリームを統合し、43 か国の急性食料不安に対する 90 日後の確率予測を毎週生成するとともに、すべての予測を公開検証可能な形で記録する、初の確率的かつオープンアクセスの早期警戒システム「CERES」を提案するものです。
この論文は、大規模言語モデルが道徳的推論を常識的理解よりも優先する傾向にあること、特に物語の語り手ではなく二次的な登場人物に矛盾が割り当てられた場合にのみその矛盾を検出しやすい「物語焦点バイアス」が存在することを、新規ベンチマーク「CoMoral」を用いた評価を通じて明らかにし、常識の堅牢性を高めるための推論重視のトレーニングの必要性を訴えています。
この論文は、EU 人工知能法への準拠評価を支援するため、大規模言語モデルとドメイン知識を組み合わせることで作成された、リスク分類や義務生成などのタスクを含むオープンで再現性の高いデータセットと評価手法を提案するものです。
この論文は、臨床ガイドラインの更新に柔軟に対応し、再学習なしでゼロショットで放射線治療の標的体積を自動描画する新しい AI エージェント「OncoAgent」を提案し、その性能が教師ありモデルと同等でありながら医師からの評価も高いことを示しています。
この論文は、大規模な基礎モデルにおける不確実性の定量化と計算コストの両立を実現するため、混合専門家(MoE)層のルーティング段階にベイズ推論を限定した「変分混合専門家ルーティング(VMoER)」を提案し、較正誤差の大幅な削減と分布外データに対する性能向上を、計算コストの増加を最小限に抑えながら達成することを示しています。
本論文は、自律走行車のシナリオベーステストにおいて、宣言的な OpenSCENARIO 仕様を実行可能なシミュレーションに変換し、多様な行動バリエーションを体系的に生成するオープンソースツール「RoadLogic」を提案し、その有効性を示すものである。
本論文は、異なるタスクに特化したモデルを結合する際に生じる「結合崩壊」現象を特定し、パラメータ空間の競合ではなく表現の非互換性がその主因であることを実証的に示すとともに、レート歪み理論を用いてタスクの結合可能性に本質的な限界があることを理論的に説明するものである。
本論文は、視覚エンコーダの解凍による知覚性能の低下と長期計画における不安定性という課題を解決するため、自己アンカー型知覚制約とオラクル指導軌道最適化を統合した新しい協調的知覚・計画蒸留フレームワーク「EvoDriveVLA」を提案し、オープンループおよびクローズドループ評価の両方で最先端の性能を達成したことを報告しています。
この論文は、外部の報酬に依存せず、無知・驚き・陳腐化という3つの認知的ギャップから優先度を内生的に生成する「Telogenesis」を提案し、これが固定戦略を上回る適応性を示すだけでなく、環境の隠れた変動構造を教師なしで回復できることを実証しています。
この論文は、大規模言語モデルを活用した進化アルゴリズムを用いて PDDL で記述された古典的計画タスク向けの汎用的なプランナーを自動生成する「GenePlan」という新しいフレームワークを提案し、既存の最先端プランナーと同等の性能を発揮しながら、他の LLM ベースの手法を大幅に上回る結果を示したことを報告しています。
本論文は、人間と生成 AI の相互作用が「ツール」や「協働」を超えた「第三の存在」としての新たな認知・認識論的形態を生み出し、その非反射的な「雰囲気創造(vibe-creation)」と非対称的創発の概念を通じて、教育や知の再定義を迫る理論的枠組みを提示している。
この論文は、過去の観測値に基づいて正常な時系列データの確率分布を正確にモデル化し、低確率事象を検出することで多変量時系列の異常検知を可能にする「時系列条件付き正規化フロー(tcNF)」という新しい枠組みを提案し、その有効性を検証したものである。
本論文は、事前学習されたビジョン・言語モデルの知識を維持しつつ少量データで効果的に適応させるため、プロンプトの進化経路を明示的に制御し、方向性を保持しながら更新を行う「EvoPrompt」という新しいフレームワークを提案するものである。