Estimating condition number with Graph Neural Networks
この論文では、スパース行列の条件数を高速に推定するために、効率的な特徴量設計とグラフニューラルネットワーク(GNN)を活用した新たな手法を提案し、Hager-Higham 法や Lanczos 法と比較して大幅な高速化を実現したことを示しています。
2316 件の論文
この論文では、スパース行列の条件数を高速に推定するために、効率的な特徴量設計とグラフニューラルネットワーク(GNN)を活用した新たな手法を提案し、Hager-Higham 法や Lanczos 法と比較して大幅な高速化を実現したことを示しています。
この論文は、ノイズのあるユーザーフィードバックやプロパティスコアの欠如といった課題に直面する大規模生成型レコメンデーションシステムにおいて、報酬モデルの学習を不要とし、理論的保証を持つ「指数関数的報酬重み付け SFT」が、従来の RLHF 手法よりもロバストかつ効果的にユーザー嗜好に適合できることを示しています。
この論文は、ADMM 反復とスコアベースの去噪器の間の manifolds の不一致を解消し、収束性を保証する新しい「AC-DC 去噪器」を組み込んだプラグアンドプレイフレームワークを提案し、逆問題における解の品質向上を実証しています。
この論文は、幾何学的構造を尊重する学習の観点から一般化特異値分解(GSVD)を用いて2つのデータセットを比較し、各サンプルがどちらのデータセットに由来するかを定量化する解釈可能な「角度スコア」を提案し、MNIST における診断ツールとしての有効性を示しています。
この論文は、Copula-ResLogit と呼ばれる深層学習とコピュラモデルを統合した新しいフレームワークを提案し、交通需要分析における観測されない交絡因子による非因果的依存関係を検出・軽減することで、真の因果効果を明らかにする手法を示しています。
LLM による評価スコアにおける計算コストとバイアスの課題を解決し、評価スコアテンソルの構造を解明するため、質問・回答者・評価者の各モードに対してクラスタ所属と代表点(メドイド)を同時に推定する新しいテンソルクラスタリング手法「MultiwayPAM」を提案し、その有効性を実データで実証した。
この論文は、Pong という競争的マルコフゲームにおける量子古典ハイブリッドエージェントの実験を通じて、量子もつれが表現学習に不可欠なリソースとして機能し、分離可能な回路や古典的なニューラルネットワークを凌駕する競争優位性をもたらすことを実証しています。
この論文は、人間の記憶の構造と自己進化の特性に着想を得て、離散的高レベル記号ノードと連続的軌道埋め込みを結合したグラフベースのハイブリッド自己進化構造化メモリ「HyMEM」を提案し、これによりオープンソースの GUI エージェントが強力なクローズドソースモデルと同等かそれ以上の性能を発揮することを示しています。
GaLoRA は、テキスト属性グラフのノード分類タスクにおいて、フルファインチューニングの 0.24% のパラメータ数で最先端モデルと同等の性能を発揮する、構造化情報を大規模言語モデルに効率的に統合するパラメータ効率型フレームワークです。
この論文は、パラメータの微調整を行わずに事前学習済み大規模言語モデル(LLM)を用いて市場のレジームを推定し、条件付きで選択されたデモンストレーションを文脈に組み込むことで、非定常な市場環境下における金融ボラティリティの予測精度を向上させる「レジーム対応型インコンテキスト学習フレームワーク」を提案するものである。
この論文は、学習率スケジュールの形状を最適化する探索手法を提案し、ウォームアップと減衰が重要であることを示しつつ、既存のスケジュールが最適ではないことと、重み減衰が最適な形状に強い影響を与えることを明らかにしました。
本論文は、抗体治療薬の設計において、マスク言語モデルから目的の生物学的特性を最適化するための柔軟かつ効果的なサンプリング手法(確率的ビームサーチ)を提案し、その有効性を計算機シミュレーションおよび実際の抗体エンジニアリング実験を通じて実証したものである。
この論文は、非局所的な情報集約と局所的な非線形予測を明示的に分離する「データ駆動型積分カーネル」という枠組みを導入することで、気候プロセスの学習における解釈性と過学習の課題を解決し、南アジアのモンスーン降水量予測において、パラメータ数を大幅に削減しながら高い予測精度を達成する手法を提案しています。
NasoVoce は、スマートグラスの鼻架に装着されたマイクと振動センサーを融合させることで、環境雑音に強くかつ低音量の発話も認識可能な、常時利用可能な静かな音声対話インターフェースの実現を提案する研究です。
この論文は、極端な非 IID 環境とグローバルなクラス不均衡下におけるフェデレーテッド・アクティブ・ラーニングの課題を解決するため、グローバルとローカルなモデルの適応的選択やクラス公平性を重視したサンプリング戦略を採用し、既存手法を上回る性能を示す「FairFAL」という新しいフレームワークを提案しています。
この論文は、非定常線形バンディット問題における固定予算ベストアーム同定(BAI)の複雑性を研究し、従来の次元に比例する複雑度評価の限界を克服するアーム集合依存の下限を導出するとともに、これに基づいて提案された「Adjacent-BAI」アルゴリズムがその下限と一致する誤り確率を達成することを証明し、アーム集合の幾何学的構造に依存した最適複雑性を確立したものである。
本論文は、教師モデルの失敗例を排除する従来の限界を克服し、教育理論の「最近接発達領域」に基づいて、エントロピーに基づく修復や段階的カリキュラム学習を組み合わせる RL フリーのフレームワーク「HEAL」を提案し、大規模推論モデルから小規模モデルへの推論能力の蒸留を大幅に改善することを示しています。
この論文は、スパースオートエンコーダと微分可能な構造学習を組み合わせることで大規模言語モデルの潜在空間に因果概念グラフを構築し、多段階推論における概念間の因果依存関係を可視化するとともに、介入実験による評価スコア(CFS)で既存手法を上回る性能を実証する手法を提案しています。
この論文は、Mixture-of-Experts(MoE)モデルにおいて、トータルな計算量とスパース性に応じてエキスパート層とアテンション層への計算リソース配分を最適化するべき比率をべき乗則として導き出し、Chinchilla の法則を拡張したスケーリング法則を提案するものである。
この論文は、拡散モデルの訓練におけるノイズレベルごとの損失分散の偏りに着目し、分散に応じた適応的重み付け戦略を提案することで、CIFAR-10 や CIFAR-100 において FID の改善と訓練の安定化を実現したことを報告しています。