Geometry-Aware Probabilistic Circuits via Voronoi Tessellations
本論文は、確率回路(PC)の混合重みにボロノイ分割を導入してデータ多様体の局所幾何構造を捉えることを提案し、その計算の困難さに対処するために近似推論枠組みと厳密な推論を可能にする構造条件の 2 つの解決策を提示するとともに、微分可能な緩和手法を通じて勾配ベースの学習を可能にしています。
2315 件の論文
本論文は、確率回路(PC)の混合重みにボロノイ分割を導入してデータ多様体の局所幾何構造を捉えることを提案し、その計算の困難さに対処するために近似推論枠組みと厳密な推論を可能にする構造条件の 2 つの解決策を提示するとともに、微分可能な緩和手法を通じて勾配ベースの学習を可能にしています。
本論文は、多様なセンサー設定に汎用可能な言語整合表現を学習するためのオープンソースフレームワーク「SLIP」を提案し、対照的アライメントとセンサー条件付きキャプション生成を統合することで、ゼロショット転移や信号の要約、質問応答などのタスクにおいて既存手法を上回る性能を実現したことを報告しています。
この論文は、大域的低ランク仮定に依存する従来の手法の限界を克服し、重み付きスペクトル分解を用いて局所的な低次元構造を抽出する「局所隣接スペクトラル埋め込み(LASE)」を提案し、その理論的保証と実ネットワークにおける高品質な可視化への有効性を示しています。
この論文は、表現学習モデルの安定性を「統計的識別可能性」と「構造的識別可能性」に定義し、非線形デコーダを持つモデルの中間表現に対する近似的な識別可能性を理論的に証明するとともに、ICA による後処理を実用的な解像法として提案し、合成データから細胞顕微鏡画像の基礎モデルまで、多様なタスクで優れた解離性能を実証しています。
この論文は、DeepONets のアーキテクチャをバナッハ空間から任意のハウスドルフ局所凸空間へ拡張し、連続線形汎関数を用いたトポロジカルな枝・幹ネットワーク構成により、その空間上の連続作用素が一様近似可能であることを示すことで、従来の Chen-Chen 作用素近似定理を一般化しています。
本論文は、データ再利用による相関を扱う新たな平均安定性解析手法を開発し、多パス前処理付き確率勾配降下法(PSGD)の汎化性能が、人口リスクの曲率と勾配ノイズの幾何学的な不一致によって決まる「有効次元」に依存することを示し、不適切な前処理が最適化と汎化の両面で性能を劣化させることを証明しています。
本論文は、従来の NLI ベースのモデルに加え、埋め込みモデルやリランカー、大規模言語モデルを含む多様なゼロショットテキスト分類アプローチを公平に評価するための包括的ベンチマーク「BTZSC」を提案し、最新の 8B パラメータのリランカーが最高性能を達成しつつ、埋め込みモデルが精度と遅延のバランスにおいて優位であることを示しています。
この論文は、クライアント数に依存せず少数の共有モデル(K 個)で多数のクライアントを効率的にパーソナライズする「Few-for-Many」最適化問題を定式化し、クラスタリングや補間などの既存手法よりも優れた性能を達成する新しいアルゴリズム「FedFew」を提案するものです。
この論文は、複数の管理ドメインにまたがる流体コンピューティング環境における分散型オーケストレーションアーキテクチャを提案し、その有効性をマルチドメインのビザンチン耐性分散フェデレーション学習(DFL)の事例において、SDN による異常検知メカニズム「FU-HST」を用いて検証したものである。
この論文は、パラメータおよび予測的不確実性を同時に考慮する深層学習メタモデル(MLP-LSTM、MPNN-LSTM、AE-LSTM)を提案し、多自由度 Bouc-Wen 系および 37 階建鋼製ラーメン構造の事例を通じて、これらのアーキテクチャが非線形確率動的システムの高精度な予測と信頼性評価に有効であることを実証しています。
本論文は、サイバーフィジカルシステム(CPS)の複雑なモデリングを自動化し、モジュール性と使いやすさを重視したデータ駆動型の学習フレームワーク「Flowcean」を提案するものである。
本論文は、生成モデルにおけるユニタリ行列積状態の効率性と表現力を高めるため、多様体制約付き最適化問題として確率モデルを定式化するリーマン幾何学最適化手法と、空間を分離する効率的なアルゴリズムを開発し、バーズ・アンド・ストライプスおよび EMNIST データセットでの実験によりその有効性を示したものである。
この論文は、大規模クラスターのスケーラビリティ、文脈認識能力、および動的な負荷への適応性を向上させるため、中央集権的訓練と分散実行を組み合わせた協調型マルチエージェント強化学習、グラフニューラルネットワーク、およびストレス感知の辞書式順序化ポリシーを導入した「AGMARL-DKS」という新しい Kubernetes スケジューラを提案し、Google Kubernetes Engine 上での評価においてデフォルトのスケジューラよりも優れたフォールトトレランス、リソース利用率、およびコスト効率を実現したことを示しています。
この論文は、事前データ適合ネットワーク(PFN)に基づく因果推定推定量が頻度論的整合性を欠く問題を指摘し、マルティンゲール事後分布を用いた一歩事後補正(OSPC)を導入することで、平均処置効果(ATE)の推定において頻度論的整合性と適切な不確実性定量化を回復させる手法を提案しています。
この論文は、文内や意味的に一貫した区間におけるアテンションサポートの安定性という観察に基づき、既存のモデルを再学習することなく推論コストを大幅に削減し、品質を維持しながらスループットを向上させるトレーニングフリーの「Slow-Fast Inference」フレームワークを提案しています。
本論文は、事前学習済み視覚言語モデルの継続学習において、対抗的アンカーと幾何学的蒸留を用いて新旧タスク間のセマンティック幾何構造を保存し、エクスンプラフリー制約下でカタストロフィックフォージングを抑制する「SeGP-CL」という手法を提案し、複数のベンチマークで最先端の性能を達成したことを報告しています。
この論文は、隠れ層を持たない化学反応ネットワークが、隠れ層を必要とするスパイクニューラルネットワークよりも優れた学習能力と分類精度を数学的に証明し、生化学的反応ネットワークが生物学的学習においてより効率的である可能性を示唆しています。
この論文は、転写因子の結合部位予測を単一の因子や二値分類ではなく、転写因子間の相関や協調的な制御メカニズムを捉える多ラベル分類問題として定式化し、時系列畳み込みネットワーク(TCN)を用いて生物学的に意味のあるモチーフや新たな共結合パターンを抽出する深層学習フレームワークを提案しています。
この論文は、ドメイン間の状態・行動空間の不一致と負の転移という課題を、転移可能性を測定する「クロスドメイン・ベルマン整合性」と、ソースおよびターゲットドメインの Q 関数を適応的に結合するハイブリッドクリティック「QAvatar」を導入することで解決し、効率的なクロスドメイン強化学習を実現する手法を提案しています。
この論文は、単一のコンシューマー向け GPU 上で大規模言語モデル(LLM)の微調整なしに、履歴フィードバックメモリと双 LLM 特化アプローチを用いて効率的に画像分類用ニューラルネットワークを自動設計し、低予算かつ再現性のあるハードウェア認識型 NAS パラダイムを確立する手法を提案するものです。