RbtAct: Rebuttal as Supervision for Actionable Review Feedback Generation
この論文は、査読者のコメントが著者によってどのように修正や反論に結びついたかを示す「反論(rebuttal)」を教師信号として活用し、LLM が具体的かつ実行可能な査読フィードバックを生成するための新しい手法「RbtAct」と大規模データセット「RMR-75K」を提案し、その有効性を示したものである。
2384 件の論文
この論文は、査読者のコメントが著者によってどのように修正や反論に結びついたかを示す「反論(rebuttal)」を教師信号として活用し、LLM が具体的かつ実行可能な査読フィードバックを生成するための新しい手法「RbtAct」と大規模データセット「RMR-75K」を提案し、その有効性を示したものである。
この論文は、実世界の一人称視点動画から構築された新しいベンチマーク「EXPLORE-Bench」を提案し、マルチモーダル大規模言語モデルが長期的な物理的帰結を推論する能力に依然として大きな課題があることを示すとともに、段階的推論による性能向上の可能性と計算コストのトレードオフを分析しています。
この論文は、大規模視覚言語モデルの内部アテンション機構から対象概念を主に表す視覚トークンを抽出してメモリとして活用する効率的な手法「Ego」を提案し、追加学習や外部モジュールなしで単一・複数概念および動画の個人化において最先端の性能を達成することを示しています。
生物の空間認知メカニズムに着想を得たトレーニング不要のツール「World2Mind」は、3D 再構成と楕円パラメータを用いたアロセントリック空間木(AST)の構築により、マルチモーダル基盤モデルの空間推論能力を大幅に向上させ、テキストのみのモデルでも高度な 3D 空間推論を可能にします。
本論文は、シミュレーションベース推論(SBI)を用いてニュートリノ事象生成器 GENIE のモデルパラメータを推定する手法を検証し、MicroBooNE 実験データに基づく従来手法と比較してわずかに異なるパラメータ値を導き出し、異なるシミュレーションコード(NuWro)の近似も可能であることを示した。
この論文は、大規模言語モデルが外部化せずに推論を行う可能性の限界を定量化する新概念「不透明な直列深さ」を提案し、Gemma 3 モデルや MoE 構造などのアーキテクチャに対する数値的上限を計算する自動化手法を開示することで、モデルが外部化されていない推論を行う潜在的な能力を評価する枠組みを提供しています。
本論文は、LSTM と量子回路ボーンマシン(QCBM)を統合したハイブリッド量子古典フレームワークを提案し、上海証券取引所などの実データを用いた実験で、従来の古典モデルを上回る金融市場ボラティリティ予測精度を達成したことを示しています。
この論文は、スプリット学習における通信オーバーヘッドを削減するため、ラベル情報を活用してチャネルの重要度を評価し、重要度の低いチャネルを適動的に剪定して中間特徴データを圧縮する「ACP-SL」という新しい手法を提案し、その有効性を示したものです。
本論文は、CERN の CMS 実験など大規模科学コラボレーションにおける機密性を保ちつつ、内部ドキュメントから高精度に知識を抽出・回答するためのオンプレミス型 RAG ベースの AI アシスタント「MITRA」のプロトタイプとその評価結果を提示しています。
本論文は、偏微分方程式の数値解法におけるマルチグリッド法に着想を得た軽量な修正モジュール「疑似射影体」を提案し、トランスフォーマーベースのモデルに組み込むことでノイズへの感度を低減し、学習の安定性とロバスト性を向上させることを実証しています。
本論文は、複数の具象化エージェントから同時に収集された長時間の第一人称視点動画を理解する新たな課題を定義し、その評価のためのベンチマーク「MA-EgoQA」と、エージェント間の共有メモリと動的検索を活用するベースラインモデル「EgoMAS」を提案しています。
この論文は、アクセシビリティ技術や産業用ノイズ監視のニーズに基づき、音声認識を超えた背景音の理解や雑音の局所化など多様な音声理解能力を評価する新しいベンチマーク「SCENEBench」を提案し、最先端の大型音声言語モデルの現状と課題を明らかにしたものである。
この論文は、地理空間データを用いてスペクトル需要を予測し、空間的自己相関の問題を解決することで既存モデルより 21% 高い精度を達成する階層型アテンションネットワーク「HR-GAT」を提案し、5 つの主要カナダ都市でその有効性を実証したものである。
本論文は、複雑な環境における接触誘発ダイナミクスを明示的な世界モデルで学習し、これを強化学習に条件付ける「DAPL」フレームワークを提案することで、人手による接触ヒューリスティックや複雑な報酬設計なしに、乱雑な環境下での外因的巧緻性を実現する手法を提示しています。
この論文は、継続的学習におけるバックボーンと分類器の不一致を解消し、忘却を抑制して性能を向上させるために、新しい「局所分類器アライメント(LCA)」損失関数を提案し、モデルマージ手法と組み合わせた包括的な解決策を提示するものである。
この論文は、強化学習を用いずにプロンプトをパラメータ化された「行動」として扱いつつ、エージェントの状態に基づいて動的にプロンプトを構築する軽量な方策フレームワークを提案し、これによりマルチエージェント対話のダイナミクスを効果的に制御できることを示しています。
この論文は、逐次学習における大規模言語モデルの忘却を抑制しつつ適応性を維持するため、サンプルごとの記憶強度を推定し適応的にリハーサルをスケジュールする新しい経験再生フレームワーク「MSSR」を提案し、広範な実験で最先端の手法を上回る性能を実証したものである。
本論文は、医療マルチエージェントシステムのアーキテクチャ断絶と標準化不足を解決するため、11 の異種アーキテクチャと 24 の医療モダリティを統合し、11 の臓器系・473 の疾患にわたる包括的なベンチマークと自動臨床推論評価機能を提供する統一フレームワーク「MedMASLab」を提案するものである。
この論文は、ライセンスデータやクラウドソーシングデータなどの複数の代理指標を用いた AI・機械学習アプローチにより、5 つの主要カナダ都市で実測トラフィックデータと高い相関(R²=0.89)を示すスペクトル需要予測モデルを提案し、動的な周波数資源の効率的な配分と政策立案を支援することを目的としています。
この論文は、利用可能な画像データと臨床メタデータを動的に統合し、GPT-4o による意味的ガイダンスを取り入れた適応型臨床意識潜在拡散モデル「ACADiff」を提案し、アルツハイマー病診断における多モダリティ脳画像の欠損補完と高品質な合成を実現したことを述べています。