Online Minimization of Polarization and Disagreement via Low-Rank Matrix Bandits
この論文は、エージェントの先天的な意見が未知であるオンライン環境下で、低ランク行列バンディットに基づく二段階アルゴリズムを提案し、Friedkin-Johnsen 意見動力学モデルにおける分極と不一致を最小化する累積後悔の理論的上限を導出するとともに、その有効性を示すものです。
7103 件の論文
この論文は、エージェントの先天的な意見が未知であるオンライン環境下で、低ランク行列バンディットに基づく二段階アルゴリズムを提案し、Friedkin-Johnsen 意見動力学モデルにおける分極と不一致を最小化する累積後悔の理論的上限を導出するとともに、その有効性を示すものです。
本論文は、非因果的アテンションマスクを因果的に変更してドラフトトークンを生成し、モデル統合型のスペキュレイティブサンプリング機構により並列検証を行う「自己スペキュレイティブ・マスクド拡散」を提案し、離散データ生成における標準的なマスクド拡散モデルと比較して、ネットワークの順伝播回数を約半分にするのに成功したことを報告しています。
TCR-EML は、既知の TCR-pMHC 結合メカニズムに基づくプロトタイプ層をプロテイン言語モデルに統合することで、予測精度を維持しつつ「設計による説明性」を実現する新しい手法を提案する。
本論文は、偏微分方程式のタスクにおいて既存手法をそのまま適用するとデコーダ専用モデルがエンコーダ専用モデルに劣ることを示しつつ、並列反転とシーケンス倍増という 2 つの双方向性を模倣する新規手法を提案することで、デコーダ専用モデルの性能を大幅に向上させ、エンコーダモデルとの性能差を解消したことを報告しています。
この論文は、大規模言語モデルの評価におけるマイクロベンチマークが、完全なベンチマークや無作為なデータ抽出と比較してモデルの性能差を一貫して正しくランク付けできず、特に類似した性能を持つモデルを区別するには数百のサンプルが必要となり、その規模では既存のマイクロベンチマーク手法が無作為抽出と同等の信頼性しか持たないことを示しています。
本論文は、ぼやけたグローバルな予測「キャンバス」を非一様マスクとして導入し、動きに応じたサンプリング順序やコンポジション型の Classifier-Free Guidance を組み合わせることで、少ないサンプリングステップで高品質な動画生成を実現する新しい自己回帰モデル「CanvasMAR」を提案するものです。
本論文は、外部の検証器(人間や高性能モデル)による合成データの検証プロセスを導入することで、モデル崩壊を回避し短期的な性能向上を実現できる一方、長期的には検証器の知識中心に収束し、検証器の完全な信頼性がなければ初期の改善が頭打ちや逆転する可能性があることを、理論と実験を通じて明らかにしています。
この論文は、連続時間混合単調性手法を活用してニューラル ODE の到達可能集合を効率的に過近似する新しい区間ベースの検証手法を提案し、厳密性と計算効率のトレードオフを最適化することで、高次元かつリアルタイムな安全クリティカルなアプリケーションへの適用を可能にすることを示しています。
この論文は、部分観測かつノイズを含むデータから動的な障害物の非線形予測モデルをリアルタイムで学習するオンライン枠組みを提案し、ハンケル行列とページ行列を用いた特異値硬しきい値処理およびカドゾウ射影によるノイズ除去とランク推定、そして時間変化するハンケル-DMD による多ステップ予測を実現し、シミュレーションおよび実機実験でその有効性を検証したものである。
本論文は、トークンレベルの KL 発散を利用して安定した高信頼度予測を特定し、追加のモデル学習なしに反復ごとに複数のトークンをマスク解除することで、生成品質を維持しつつ推論速度を大幅に向上させる新しいサンプリング手法「KLASS」を提案し、言語から画像・分子生成まで多様なドメインで最先端の性能を示したものである。
この論文は、カテゴリカルデータおよび混合データにおけるクラスタ内の属性分布の違いを反映して距離を適応的に更新する「クラスタカスタマイズ適応距離指標(CADM)」を提案し、14 のデータセットで平均順位 1 位を達成する高い有効性を示したものである。
この論文は、視覚・気候・地理データを統合して推論する大規模ベンチマーク「FireScope-Bench」と、強化学習および視覚的監督を活用して推論プロセスを伴う高解像度の野火リスク予測モデル「FireScope」を提案し、言語ベースの推論が視覚生成モデルの汎化性能と解釈可能性を向上させることを実証しています。
この論文は、人間のナビゲーションにおける認知的・経験的要因を考慮し、知覚された経路の不確実性を潜在状態として予測するマルチモーダルなナビゲーションフレームワーク「EgoCogNav」と、実世界での多様なナビゲーション行動を捉えた新しいデータセット「CEN」を提案するものです。
本論文は、推論モデルのテスト時適応において、多数決に基づく報酬が回答の短縮や性能低下を招く問題を解決するため、推論の分岐点となる高エントロピーのトークンのみを対象とした選択的な更新とエントロピー帯域正則化を導入した「SPINE」という新しいフレームワークを提案し、ラベルなしで安定した性能向上を実現することを示しています。
DAISI は、流に基づく生成モデルと逆サンプリング手法を組み合わせて、複雑な非線形ダイナミクスや疎な観測条件下でも従来の手法を上回る精度で状態推定を可能にする、スケーラブルなデータ同化アルゴリズムを提案するものである。
この論文は、拡散モデルの微調整における報酬過最適化と多様性の低下を解決するため、再パラメータ化されたソフト Q 関数の方策勾配を用いた KL 正則化強化学習手法「SQDF」を提案し、割引因子や一貫性モデル、オフポリシー再生バッファなどの革新により、高報酬と自然な多様性の両立を実現したことを述べています。
本論文は、強化学習による推論モデルの多様性欠如を解決するため、正解を保持した目標分布を-ダイバージェンスで近似し、精度と多様性のトレードオフを制御する新しい手法を提案し、Lean 定理証明ベンチマークでcoverage 軸において既存手法を上回る性能を達成したことを示しています。
この論文は、非同期 LLM 学習における計算オーバーヘッドを削減し、プロキシポリシーを単純な補間で近似する「A-3PO」手法を提案することで、性能を維持しつつトレーニング速度を 1.8 倍に加速させることを示しています。
本論文は、複雑な背景における小物体検出の課題を解決するため、入力適応型のスパース自己注意機構、ノルム保存型アップサンプリング、および周波数領域での反復精化を組み合わせた DFIR-DETR を提案し、NEU-DET と VisDrone データセットで高い検出精度を達成したことを報告しています。
この論文は、反応経路の構造変化を可視化し異なる計算手法の最適化履歴を比較可能にするため、反応物と生成物からのパーミュテーション補正された RMSD を基にした 2 次元射影と勾配強化ガウス過程を用いたエネルギー面マッピングという新しい手法を提案し、複数の化学反応系におけるその有効性を検証したものである。