ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models
この論文は、大規模視覚言語モデル(LVLM)が文脈的不整合下で物体認識に失敗する現象を「ORIC」フレームワークを用いて分析し、不整合な文脈における認識精度の低下を実証するとともに、視覚強化学習による微調整でモデルの信頼性を向上させる手法を提案しています。
6789 件の論文
この論文は、大規模視覚言語モデル(LVLM)が文脈的不整合下で物体認識に失敗する現象を「ORIC」フレームワークを用いて分析し、不整合な文脈における認識精度の低下を実証するとともに、視覚強化学習による微調整でモデルの信頼性を向上させる手法を提案しています。
この論文は、ハミルトン・ヤコビの到達可能性解析とハイパーネットワークを活用して、部分的に観測可能な環境においても最大安全集合を近似し、厳密な安全性保証を提供する「観測条件付き残差ニューラル制御バリア関数(ORN-CBF)」を提案し、地上ロボットおよびクアッドコプターの実験を通じてその有効性を検証したものである。
この論文は、マルコフ連鎖における擬スペクトルギャップの実証的上界を導出することで、依存データに対する初めて完全な実証的 PAC-ベイズ汎化誤差限界を確立したことを報告しています。
この論文は、言語モデルの有害行動を検出する白箱モニター(線形プローブ)が、システムプロンプトや思考過程などの「テキスト的な証拠」に過度に依存しており、それらが除去されると検出性能が大幅に低下する脆弱性があることを示しています。
本論文は、エッジが疎な二部知識グラフにおけるリンク予測の課題に対し、既存のエッジのみを再サンプリングしてノード集合を維持する「AEGIS」というデータ拡張フレームワークを提案し、特に意味的 KNN による拡張が、自然に疎なグラフや人工的に疎化されたベンチマークにおいて予測精度と較正を向上させることを実証しています。
本論文は、テキストや画像などのマルチモーダルデータからドメイン固有の知識を適応的に抽出し、ゼロショット推論を可能にするマルチモーダル時系列基礎モデル「Aurora」を提案し、複数のベンチマークで最先端の性能を達成したことを報告しています。
この論文は、観測データから潜在結果の分布を推定する際に、準オラクル効率性と二重頑健性という望ましい理論的性質を持つ、条件付き正規化フローや拡散モデルなどの最先端生成モデルを汎用的に実装できる「GDR-learners」という新しい学習フレームワークを提案し、既存手法を上回る性能を実証しています。
この論文は、ウェアラブルセンサーを用いた継続的な活動認識において、異なる被験者間のデータ分布のシフトやラベル不足という課題に対処するため、自己教師ありトランスフォーマーと知識蒸留を組み合わせた「CLAD-Net」というフレームワークを提案し、過去の知識を忘却することなく高い精度を維持できることを示しています。
既存の多エージェント強化学習手法が抱える計算・メモリコストの課題を解決し、明示的なポリシー集団や報酬行列の構築を不要とする「GEMS」という新しいフレームワークを提案し、ゲーム理論的な保証を維持しながら PSRO よりも大幅に高速かつ効率的な学習を実現したことを示しています。
この論文は、任意の置換対称性グループに対して対称性を保つように設計された新しい「関数共有 KAN(FS-KAN)」を提案し、理論的な表現力の保証と、低データ環境における標準的なパラメータ共有層を上回るデータ効率の実証を通じて、その有効性を示しています。
この論文は、低重なり領域における条件付き平均処置効果(CATE)推定の精度向上を目指し、既存のメタラーナーに重なり重みに比例して正則化を適用する「重み適応正則化(OAR)」という新しい手法を提案し、その有効性を示しています。
この論文は、事前の類似性情報が存在しないコールドスタート局面において、能動学習を通じて効率的にペアワイズ類似性を取得し、多様性を促進するカバレッジ意識型の手法を提案し、その有効性を合成および実世界のデータで実証するものです。
この論文は、制御理論を応用したバケット化ヒステリシスと比例フィードバックを組み合わせた新しい手法を提案し、特に小規模予算の広告キャンペーンにおいて、従来の手法に比べて支出の精度と安定性を大幅に向上させることを示しています。
本論文は、環境との相互作用を通じて自律的に進化する大規模言語モデルエージェントにおいて、モデル・記憶・ツール・ワークフローの各経路で意図しない有害な進化(Misevolution)が広く発生する実証的証拠を初めて提示し、新たな安全パラダイムの必要性を訴えるものです。
この論文は、観測データを用いたマルコフ決定過程における個別化潜在結果の推定問題に対し、二重頑健性、ネイマン直交性、準オラクル効率性という優れた理論的性質を備え、任意の機械学習モデルと組み合わせ可能な新しいメタ学習器「DRQ-learner」を提案し、その有効性を理論的および実験的に実証したものである。
この論文は、感度 bound が不明なブラックボックス関数に対する差分プライバシー推定において、統計的効率とオラクル効率のトレードオフを可能にする新たな手法とその最適性下限を提示するものである。
この論文は、エージェントが独立して応答を生成し、シャープレー値の近似を用いて相互の貢献度を評価することで、追加の教師信号や学習なしに動的な通信構造(DAG)を自己組織化し、特に弱い LLM 環境下でも頑健な性能を発揮するマルチエージェントフレームワーク「SelfOrg」を提案するものである。
この論文は、デモンストレーション学習における実行の変動への適応性を高めるため、状態遷移パターンを学習して注意機構を調整する「Cross-State Transition Attention(STA)」メカニズムと時間的マスキングを組み合わせ、シミュレーション評価において既存の手法を大幅に上回る性能を示した新しいトランスフォーマーアーキテクチャ「CroSTAta」を提案するものである。
この論文は、ダイナミカルな変分オートエンコーダの枠組みにおいて、観測データからシステム状態とノイズの時系列を同時に推定する「二重射影法」を提案し、低次元の状態空間で多ステップ予測を可能にする新たな確率モデル学習手法を、シミュレーションおよび実験データを用いたベンチマークで検証したものである。
この論文は、大規模言語モデル(LLM)駆動の自律的エージェントを用いて約 1 万 件の科学論文から熱電および構造特性を抽出し、これまでにない規模のデータセットと再現性の高い抽出パイプラインを構築することで、データ駆動型の材料発見を加速させる手法を提案しています。