XGenBoost: Synthesizing Small and Large Tabular Datasets with XGBoost
XGenBoost は、XGBoost をスコア推定器や階層的分類器として活用し、混合タイプの表データに対して従来モデルよりも低コストで高精度な生成を実現する、小規模データ向け拡散モデルと大規模データ向け自己回帰モデルの 2 つのアーキテクチャを提案する論文です。
10296 件の論文
XGenBoost は、XGBoost をスコア推定器や階層的分類器として活用し、混合タイプの表データに対して従来モデルよりも低コストで高精度な生成を実現する、小規模データ向け拡散モデルと大規模データ向け自己回帰モデルの 2 つのアーキテクチャを提案する論文です。
この論文は、LLM による構造化情報の抽出と、確率的知識およびグラフ推論を統合した自己拡張型知識ベースが相互に強化し合う「DySECT」と呼ばれる動的自己進化型抽出・キュレーションシステムを提案するものである。
この論文は、動的環境における安全なロボットナビゲーションを実現するため、ハミルトン・ヤコビの到達可能性枠組みで訓練された複数のニューラル制御バリア関数を合成し、残差ニューラルアーキテクチャを用いて安全性を保証する「CN-CBF」という手法を提案し、シミュレーションおよびハードウェア実験で既存手法を上回る成功率を達成したことを報告しています。
本論文は、大規模言語モデルのフィードフォワードネットワークにおける高次元動的な情報フローを、スペクトルエントロピーや参加率などの 4 つの指標を用いた「NerVE」と呼ばれる統一された固有スペクトル解析フレームワークを通じて解明し、モデルの汎化性能や設計選択との関連性を示すことで、試行錯誤に頼らないアーキテクチャやオプティマイザの最適化を可能にすることを提案しています。
本論文は、状態空間モデル(SSM)の計算コストを増大させずに専門性を導入する「Switch Mamba(Swimba)」を提案し、パラメータ空間でエキスパートを混合する設計が、再帰計算のコストを固定したまま SSM の容量を拡張できることを理論的・実証的に示しています。
この論文は、コシラ弾性理論に基づく微細構造媒体の力学挙動を解析するため、変形とディレクター場を独立に表現しフレーム不変性を満たす物理整合性ニューラルネットワークを開発し、準凸性やレジェンドル・ハダマード不等式などの安定性条件を損失関数として組み込むことで、エネルギー最小化解の物理的妥当性を検証する新しい計算手法を提案している。
この論文は、複数の行動に対する反事実的な結果の結合分布を明示的にモデル化する「結合マルコフ決定過程(JMDP)」を提案し、その枠組み内で n 次リターンモーメントに対するベルマン演算子を導出することで、収束保証付きの動的計画法および増分アルゴリズムを実現するものである。
本論文は、DNABERT-2、Evo 2、NTv2 といった DNA 基盤モデルから生成された埋め込み表現が、モデル逆転攻撃によって元の遺伝子配列を再構築される脆弱性を有しており、特にトークン単位の埋め込みではほぼ完全な復元が可能であることを実証し、遺伝子データ共有におけるプライバシー保護の重要性を指摘しています。
この論文は、大規模グラフにおける GNN パイプラインのボトルネックであるデータ移動コストを軽減しつつ、ノード分類タスクの精度を維持または向上させることを示すため、グラフスパース化が軽量な前処理として有効であることを体系的に検証した研究です。
本論文は、ベースモデルのサポートを超える際に生じる「尤度分位(LQ)」という障壁を明らかにし、出力報酬を用いた方策勾配法が次元の呪いに直面するのに対し、プロセス報酬モデルを用いることでトークンレベルの LQ に依存し、次元の呪いを回避して最適に学習できることを示しています。
本論文は、数学的に検証可能な報酬を用いた強化学習手法「Chart-RL」を提案し、これにより既存の教師あり微細調整(SFT)を上回る性能でチャートの理解と推論能力を大幅に向上させ、少量の複雑なデータでも大規模な単純データよりも優れた汎化性能と他領域への転移能力を実現することを示しています。
この論文は、四足歩行の限界サイクルやポアンカレ写像の構造に基づく原理的分析から、数秒のデモンストレーションのみでオフライン学習により頑健な歩行制御ポリシーをゼロから学習する新しい模倣学習手法を提案し、ハードウェア実験でその有効性を実証しています。
本論文は、センサー故障などの有害データが機械学習モデルの性能を低下させる問題に対し、学習データを分割・独立訓練する SISA 手法を採用し、汚染データの影響を最小限に抑えつつ全モデルの再学習を回避して電力変圧器の巻線間短絡故障を高精度に特定する機械学習の忘却フレームワークを提案しています。
この論文は、極端な気象やサイバー攻撃による停電に備え、トポロジデータ分析(特に永続ホモロジー)をグラフ強化学習に組み込むことで、配電網の再構成と負荷遮断を最適化し、エネルギー供給の最大化と電圧違反の低減を実現する自律的な復旧フレームワークを提案しています。
この論文は、従来の条件付き最適輸送が持つ外れ値への敏感性という課題を解決するため、条件付き分布の整合制約を緩和する「条件付きアンバランス最適輸送(CUOT)」フレームワークと、それに基づく外れ値に頑健な生成モデル「CUOTM」を提案し、理論的裏付けと実験による有効性を示したものです。
本論文は、一般和マルチエージェント強化学習において、プレイヤーに依存しないポテンシャル関数を学習することで混合協調・競争環境における近似ナッシュ均衡を効率的に計算する新しいパイプライン「NePPO」を提案し、既存手法よりも優れた性能を実証したものである。
この論文は、拡散モデルの制御を統一的な制御理論の枠組み(LS-MDP)として再解釈し、これに基づいて事前学習済みモデルのバックボーンを凍結したまま軽量なサイドネットワークで効率的に微調整を行う「Diffusion Controller(DiffCon)」という新たな手法とアルゴリズムを提案し、Stable Diffusion における生成品質と効率性の両面で既存手法を上回る性能を実証したものである。
この論文は、因果的公平性の評価において平均処置効果(ATE)のみに依存する規制が、交絡変数によって「因果的マスキング」を引き起こし、見かけ上の公平性を維持しながら実質的な不平等を隠蔽する深刻なリスクを有することを示し、モデルレベルでの公平性規制の必要性を説いています。
本論文は、マルチモーダル大規模言語モデル(MLLM)を用いて人間を代替し、低リソース音声分類タスクにおいて高速かつ解釈可能な音声属性を適応的に発見する手法を提案し、従来の人間依存型アプローチや直接予測よりも高い性能と実用性を示したことを述べています。
本論文は、マッチングプラットフォームにおける参加者の不満や離脱を防ぐために、アームの満足度を最大化する新たなオンライン学習問題「組合せ割り当てバンドット」を提案し、そのために上界信頼区間法と Thompson サンプリング法を開発して近似後悔の理論的保証と実験的有効性を示したものである。