Transferable Graph Condensation from the Causal Perspective
この論文は、因果不変性を活用してドメインやタスクを超えて転送可能なグラフデータ凝縮手法「TGCC」を提案し、既存手法よりも優れた性能を実現することを示しています。
8570 件の論文
この論文は、因果不変性を活用してドメインやタスクを超えて転送可能なグラフデータ凝縮手法「TGCC」を提案し、既存手法よりも優れた性能を実現することを示しています。
本論文は、交通やエネルギーなどのネットワークにおいて欠落する流量を局所保存則を厳密に満たしつつ復元するための、対称性を保持するグラフ注意機構と最小ノルム補完、および陰的二階最適化によるティコノフ微調整を組み合わせた新しいアーキテクチャ「FlowSymm」を提案し、実世界データセットにおいて既存手法を上回る精度を達成したことを報告しています。
Mem-T は、長期にわたる記憶操作におけるスパースな報酬という課題を解決するため、木構造のバックプロパゲーションとヒンズサイト・クレジット割り当てを用いて段階的な密な報酬を生成する強化学習フレームワーク「MoT-GRPO」を提案し、記憶管理と検索の両方を最適化する自律型記憶エージェントを実現しています。
この論文は、ランクとスコアの組み合わせおよび認知的多様性を活用した「組合せ融合分析(CFA)」という新しいモデル融合手法をビットコイン価格予測に応用し、MAPE 0.19% という優れた性能で既存の個別モデルや他の予測手法を上回る結果を示したことを報告しています。
この論文は、従来の SGD ベースの手法では Adam 最適化器の複雑な動的挙動を捉えられないという課題を解決するため、固定状態仮説に基づく閉形式近似と「線形化ゴースト近似」を導入し、Adam 最適化器に対応した高速かつ高精度なデータ寄与度評価手法「Adam-Aware In-Run Data Shapley」を提案するものである。
シュワルツの高次価値カテゴリーは、単一の文から人間の価値を検出するタスクにおいて、厳密な階層的ゲートリングやスタンドアロンのコンパクト LLM としてよりも、閾値調整やアンサンブルによる校正、あるいは帰納的バイアスとして活用する方が、限られた計算資源下でより効果的であることが示されました。
本論文は、LLM 駆動のマルチエージェントシステムにおける記憶の均質化と情報過多という課題を解決するため、エージェント固有の文脈に合わせたコンパクトな潜在記憶を生成する学習可能なフレームワーク「LatentMem」と、その最適化手法「LMPO」を提案し、既存のアーキテクチャを改変せずにも大幅な性能向上を実現したことを示しています。
本論文は、人間の学習プロセスに着想を得た「厚み化から薄み化(T2T)」という動的報酬枠組みを提案し、誤答時には探索を促す「厚み化」、正解時には冗長性を抑制する「薄み化」を段階的に適用することで、大規模言語モデルの推論能力を大幅に向上させることを示しています。
この論文は、モデルの重みや訓練データを改変せず、LLM の推論時に実行されるチャットテンプレート(Jinja2 プログラム)を悪用することで、モデルの重みを変更することなく推論時にバックドアを仕込む新たな攻撃手法を提案し、その有効性と既存のセキュリティスキャンによる検出の難しさを示したものである。
本論文は、オブリク回帰木のスプリット学習を非線形最小二乗問題として再定式化し、減衰ニュートン法に基づく高速かつ収束が保証された最適化手法「Hinge Regression Tree (HRT)」を提案し、その普遍近似性と実データにおける高性能な予測精度を実証するものである。
この論文は、座標分離型ニューラルネットワークが や などの放射状特異性をモデル化できないことを理論的に示し、学習可能な放射冪 と対数項を組み合わせた「Radial Müntz-Szász Networks (RMN)」を提案することで、極めて少ないパラメータ数で高精度かつ物理的に整合性のある解を可能にしたことを報告しています。
本論文は、データ分布やリソースの多様性に対応し、ローカルとグローバルな知識の矛盾を解消するため、固定長のグローバルプロンプトと可変長のローカルプロンプトを組み合わせ、部分空間微調整と発散制御を導入した新しいフェデレーティドプロンプト学習フレームワーク「SDFed」を提案し、その有効性を示すものである。
この論文は、ベクトル検索と知識グラフを組み合わせたハイブリッド RAG システムにおいて、個別のコンポーネントが安全であっても結合点での権限確認が欠如すると、意図しないデータ漏洩を引き起こす「リトリーバル・ピボット攻撃」の存在を明らかにし、グラフ拡張の境界でアクセス制御を再適用することでこのリスクを低コストで解消できることを示しています。
本論文は、脳グラフのセマンティクスを損なう既存のデータ拡張手法や構造情報の欠如といった課題を解決するため、拡散モデルを用いて構造認識型のドロップ・マスク戦略とトポロジーを考慮した再構成を可能にする統合的な事前学習フレームワーク「Diffusion-Guided Pretraining」を提案し、大規模な神経画像データセットにおける一貫した性能向上を実証したものである。
この論文は、意味的な順序手がかりが乏しいオランダの自由情報開示文書(WOO)のページ順序復元タスクにおいて、セグメント長が長い場合のシーケンス・ツー・シーケンス変換器の一般化失敗やカリキュラム学習の限界を明らかにし、モデルの専門化によって長文書での性能を大幅に向上させることを示しています。
この論文は、大規模な回答データに依存せず、質問項目のセマンティック構造を自然言語処理技術を用いて分析・クラスタリングすることで、心理尺度の項目数を平均 60.5% 削減しつつも元の構成概念や心理計測特性を維持する効率的な簡素化フレームワークを提案し、その有効性を複数の尺度で実証したものである。
この論文は、Muon 系オプティマイザの更新方向の直交化に伴う不安定性を、大域 RMS 較正とエネルギーに基づく信頼領域クリッピングを組み合わせることで解決し、ウォームアップなしでも Adam 系手法を上回る安定性と収束速度を実現する「TrasMuon」という新しい最適化手法を提案しています。
この論文は、LLM ベースの推薦システムにおける評価の信頼性を損なう新たな課題として、事前学習や微調整中にベンチマークデータが漏洩し、ドメインに依存して性能が虚偽に向上したり低下したりする現象を特定・実証し、その対策の必要性を訴えています。
この論文は、瞬間速度制約を付与することで表現力と計算効率を両立し、ロボット操作タスクにおいて最先端の成功率と高速な推論を実現する、一歩でアクションを生成する新しい生成方策「平均速度方策(MVP)」を提案するものです。
本論文は、構造化された領域(有界な物理パラメータや離散 - 連続ハイブリッド変数など)に制約されるシミュレーションに基づく推論(SBI)の問題に対し、幾何学的制約と離散潜在構造の両方を統合的に扱える新しい変分フローマッチングフレームワーク「Pawsterior」を提案し、従来の手法では困難だったより広範な SBI 課題への適用を可能にするものです。