One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning
本論文は、タスク固有のプromptと共有プromptの利点を統合し、スパースな混合専門家(MoE)アーキテクチャと動的な専門家選択メカニズムを導入することで、知識干渉を抑制しつつ計算コストとメモリ使用量を大幅に削減した継続学習フレームワーク「SMoPE」を提案し、既存手法を上回る性能を実証したものである。
4312 件の論文
本論文は、タスク固有のプromptと共有プromptの利点を統合し、スパースな混合専門家(MoE)アーキテクチャと動的な専門家選択メカニズムを導入することで、知識干渉を抑制しつつ計算コストとメモリ使用量を大幅に削減した継続学習フレームワーク「SMoPE」を提案し、既存手法を上回る性能を実証したものである。
この論文は、推論言語モデルの性能とコストのトレードオフを解決するため、心理測定学に触発された軽量で解釈可能なルーティングフレームワーク「RADAR」を提案し、質問の難易度とモデルの能力を学習して最適なモデル・予算ペアに動的にルーティングすることで、最先端の手法を上回る性能と汎化能力を実証しています。
本論文では、大規模な設計空間とトレーニングコストの課題を克服するため、小規模なモデル探索とスケーリング戦略を組み合わせたモジュール型ハイブリッドモデルアーキテクチャ検索フレームワーク「Composer」を提案し、Llama 3.2 を凌駕する高性能かつ効率的な新しいハイブリッド LLM アーキテクチャを発見したことを報告しています。
この論文は、変分オートエンコーダと相互情報量に基づく拡散モデルを組み合わせた「MIG-Vis」という手法を提案し、マカク猿の側頭葉下側皮質(IT 野)の神経集団から抽出された潜在変数群が、物体の姿勢やカテゴリ間変換など明確な意味的特徴を選択的に符号化していることを実証したものである。
この論文は、マルチエージェント LLM における協調を促進する手段として、経験に基づくカリキュラム学習が設計次第で逆効果となる可能性があるのに対し、単純なコミュニケーションプロトコルの方がより信頼性の高い調整メカニズムであることを示しています。
この論文は、ウェアラブル EEG による睡眠ステージ分類において、ラベル不足を克服し臨床レベルの精度を達成するために、教師なし学習(SSL)を体系的に評価し、汎用モデルを上回るドメイン特化型パイプラインの有効性を実証したものである。
この論文は、地政学的ショックが直接デフォルトリスクを通じて、地経済的ショックが金融サイクルや政策期待を通じてそれぞれ異なる経路で主権リスクに影響を与える「ハサミ型」のパターンを、2018 年から 2025 年の 42 カ国のデータと機械学習を用いた分析によって実証し、両者のメカニズムの区別が流動性供給の効果範囲を決定づけることを明らかにしている。
この論文は、標準的な音声活動検出(VAD)モデルの特定の層に対してハイパーネットワークを用いてパーソナライズされた重みを生成する「HyWA」という手法を提案し、既存の条件付け手法と比較して精度の向上とアーキテクチャの再利用による展開の容易さを両立させることを示しています。
本論文は、クロスモーダル注意機構、Grad-CAM++ による帰属分析、および「提示 - 修正」フィードバックループを統合した説明可能なバイアス意識生成フレームワークを提案し、マルチモーダル MNIST やファッション MNIST などのベンチマークにおいて、高い精度、ロバスト性、公平性を達成したことを示しています。
この論文は、クラスタリングのコンパクト性と分離性を評価し、真のクラスタ数を決定するための新しい絶対指標を提案し、合成データおよび実データを用いて既存の指標との比較を通じてその有効性を検証したものである。
この論文は、実世界のデータセットにおけるカーネル回帰の学習曲線を、データ共分散行列と目標関数の多項式分解という 2 つの統計量のみから予測する「エルミート固有構造仮説(HEA)」を提案し、その有効性を理論的・実験的に実証するとともに、MLP の学習過程における Hermite 多項式の獲得にも言及しています。
この論文は、幾何学的な解析を用いることで、割引報酬および平均報酬の両方の設定において、ユニークかつユニチェーンな最適政策を仮定すれば、価値反復法が従来の理論よりも高速な幾何学的収束を示すことを示しています。
この論文は、LLM 推論における KV キャッシュの効率的な管理を実現するため、PCA による特徴量非相関化、適応量子化、エントロピー符号化を組み合わせた軽量な変換符号化器「KVTC」を提案し、推論精度を維持しつつ最大 20 倍(特定用途では 40 倍以上)の圧縮率を達成し、既存の手法を上回るメモリ効率化を実現することを示しています。
この論文は、気象や発電構成などの要因と電力価格の複雑な因果関係を捉え、真の因果構造を学習して時系列データに反事実的推論を可能にする「拡張時系列因果モデル(ATSCM)」を提案し、再生可能エネルギーの異なるシナリオ下での価格予測などの新たな分析を可能にすることを示しています。
この論文は、深生成モデルと構造的因果モデルを統合した時系列ニューラル因果モデル VAE(TNCM-VAE)を提案し、金融時系列データにおける因果関係と時間的依存性を維持しつつ、反事実的シナリオ分析やリスク評価を可能にする市場シミュレーターの開発を目指しています。
本論文は、エネルギー制約と部分的なチャネル観測性という現実的な条件下で、RF と光無線通信(OWC)を統合したハイブリッド IoT ネットワークのスケジューリング問題を解決するため、トランスフォーマーと組み合わせた双グラフ埋め込み多タスク学習フレームワーク「DGET」を提案し、従来の最適化手法に比べて計算複雑性を低減しつつ、Age of Information の改善と高い分類精度を実現することを示しています。
本論文は、自動車テレメトリデータに見られる「緩やかなドリフト」と「急激なスパイク」という異なる時間スケールの動的特性を、双経路エンコーダとデコーダを用いて明示的に分離することで、既存手法よりも頑健な異常検知を実現する「STREAM-VAE」を提案しています。
本論文は、医療データにおけるプライバシー漏洩リスクに対処するため、医療概念の階層構造と幾何学的制約を統合し、特定知識の効率的な忘却と汎用医療能力の維持を両立させる階層的二重戦略のアンラーニング手法を提案し、MedMCQA や MHQA などのデータセットで高い忘却率と知識保持率を達成したことを示しています。
この論文は、SEC 提出書類や傷害報告などの業界標準データを Isaac Sim の物理シミュレーションと統合し、タスク成功だけでなく実世界の経済的採算性を評価する初の物理ベースのベンチマーク「CostNav」を提案し、既存の 7 つのナビゲーション手法がいずれも経済的に成立していないことを示しています。
この論文は、現実の環境で生じる局所的な対称性の破れによる誤差伝播を抑制しつつ、対称性の利点を維持するために、対称性が保たれる領域とそうでない領域でベルマンバックアップを適応的に使い分ける「部分的に不変な MDP(PI-MDP)」の枠組みと、それに基づく効率的で頑健な強化学習アルゴリズム(PE-DQN、PE-SAC)を提案し、多様なベンチマークでその有効性を示しています。