Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control
本論文は、従来の期待値ベースの制約では捉えきれない分布の尾部リスクや分布外故障に対処するため、最適輸送枠組みを用いた第一階確率支配制約を導入し、スペクトルリスク測度を普遍的に制御する新しい安全 RLHF 手法「RAD」を提案し、有害性の向上と分布外評価における堅牢性の両立を実証したものである。
4882 件の論文
本論文は、従来の期待値ベースの制約では捉えきれない分布の尾部リスクや分布外故障に対処するため、最適輸送枠組みを用いた第一階確率支配制約を導入し、スペクトルリスク測度を普遍的に制御する新しい安全 RLHF 手法「RAD」を提案し、有害性の向上と分布外評価における堅牢性の両立を実証したものである。
本論文は、高リスクな応用において質量スペクトルからの分子構造推定の信頼性を確保するため、不確実性が高い場合に予測を保留する選択的予測フレームワークを提案し、MassSpecGym ベンチマークを用いた評価により、計算コストの低い信頼度指標や検索レベルの偶然的不確実性がリスク・カバレッジのトレードオフにおいて優れていることを示しています。
本論文では、テスト時スケーリング下での推論 LLM のランキング手法を体系化し、統計的ランキング法を実装したオープンソースライブラリ「Scorio」を提案するとともに、複数のベンチマークにおけるその有効性を検証しました。
この論文は、人間の運動の生物学的構造(サブムーブメント理論)に基づいて腕時計型 IMU 信号を「運動セグメント」というトークンに変換し、マスクされたセグメント再構成による自己教師あり学習を行うことで、ラベル付きデータの不足を克服し、既存手法を上回る人間活動認識の性能とデータ効率を実現する新たな手法を提案しています。
本論文は、大規模なマルチモーダルデータや膨大なデータセットに依存せず、3 万 9 千点の点雲のみで学習された軽量トランスフォーマー「Pointy」を提案し、その設計と統一的な評価枠組みを通じて、より大規模なモデルに匹敵する性能を達成することを示しています。
この論文は、CVE データベースに基づき大規模言語モデル(LLM)が安全なコードと脆弱なコードを区別する能力を測定する新しいベンチマーク「TOSSS」を提案し、14 種類のモデルを C/C++ および Java で評価した結果、セキュリティスコアが 0.48 から 0.89 の範囲に分布することを示しています。
本論文は、B5G 向けセルフリー mmWave ネットワークにおける物理層の盗聴検知と多 RIS 構成の最適化を、プライバシーを保護しつつ計算効率を向上させたフェデレーテッドラーニングと早期退出機構を備えた深層畳み込みニューラルネットワークを用いて実現する新たなフレームワークを提案し、非 RIS 支援方式と比較して秘匿性を約 30% 向上させることを示しています。
この論文は、LEO 衛星コンステレーションにおける動的な伝搬条件下でのビーム管理を目的として、高高度プラットフォームステーションを活用した分散学習(連合学習)を提案し、低仰角を含む実データを用いた評価により、多層パーセプトロン(MLP)よりもグラフニューラルネットワーク(GNN)がビーム予測の精度と安定性において優れていることを実証しています。
この論文は、トランスフォーマーの MLP 層が連続信号を処理する際、特定のニューロン群が「デフォルト ON」と「例外処理」の二値ルーティングを行うことで、トークンに非線形処理が必要かどうかを決定していることを示し、この二値的な構造が平滑な多項式近似の失敗や、連続値活性化の追加的な情報量と整合することを明らかにしています。
この論文は、物理モデルのパラメータ分布をマルコフ連鎖モンテカルロ法を用いてニューラルネットワークの訓練入力として取り込むことで、従来のサンプリング手法に比べて計算時間を大幅に削減しつつ、同様の不確実性定量化を達成する新しい手法を提案し、その性能損失と分布の不一致との関係を数学的に分析したものである。
この論文は、シミュレーションされたデータからパラメータを直接推定する単一の要約ネットワークを用いた頻度論的アプローチ「ForwardFlow」を提案し、有限サンプルでの正確性、汚染データへの頑健性、および複雑なアルゴリズム(例:EM アルゴリズム)の自動近似という利点を示しています。
この論文は、ガウス過程回帰と能動学習を用いた統一的なベイズ最適化ループを提案し、ポテンシャルエネルギー面上の極小点・単一鞍点・両端鞍点探索を加速するとともに、高次元システムへのスケーラビリティ向上と実用的な Rust 実装を示すものである。
この論文は、物理システムの時空間進化を学習し、長期的な予測、未学習のパラメータへの汎化、およびスペクトル分析を可能にするために、空間モードと時間発展を分離する因子分解型ニューラル陰影 DMD(ダイナミカル・モード分解)を提案するものです。
本論文は、マウスとヒトの皮質 GABA 作性介在ニューロンを対象に、パッチシーケンスデータを用いた電気生理学的特徴からトランスクリプトミクスアイデンティティへのマッピングを再現・拡張し、シーケンスモデルによる予測とマウスからヒトへの転移学習がヒトのサブクラス分類精度の向上に寄与することを示しています。
本論文は、24 次元における最適球充填特性を持つリー lattice を拡張ゴレイ符号構成に基づき検索・インデックス化・デquantization 可能に改良した「リー lattice ベクトル量子化(LLVQ)」を提案し、既存の LLM 圧縮手法を上回る性能を実現したことを報告しています。
既存のテキスト音楽生成モデルが抱える微細な時間制御の課題を、対データなしで動画イベントと音楽イベントの時間的変化構造をそれぞれ独立して捉える「イベント曲線」を用いることで解決し、動画に時間的に同期した音楽を生成するゼロショット手法「V2M-Zero」を提案した。
この論文は、表面温度の過渡測定から材料特性の定量的な 3 次元再構成を可能にする、微分可能な物理ソルバーを基盤としたニューラル場熱トモグラフィ(NeFTY)という新しいフレームワークを提案し、従来の手法が抱える側方拡散の無視や勾配の剛直性などの課題を克服して内部欠陥の高精度な特定を実現することを示しています。
XConv は、中間活性化の保存によるメモリ消費を大幅に削減しつつ、既存のコードやアーキテクチャを変更することなく、標準的なバックプロパゲーションと同等の性能を維持する低メモリ確率的バックプロパゲーション手法を提案する。
この論文は、中央集権型協調学習の欠点を克服する分散型協調学習(DFL)の手法を体系的にレビューし、従来の分散型とブロックチェーン型に分類して課題を整理するとともに、評価手法の限界を指摘し、トポロジーを考慮した脅威モデルやプライバシー概念、インセンティブ設計、および個人化モデルの必要性など、今後の研究の方向性を提言するものである。
本論文は、多変量版のランダム部分和問題の進展を活用して、ランダムに初期化された畳み込みニューラルネットワークに、学習なしで任意のより小さなネットワークを近似できる構造化された「勝てるくじ」が存在することを証明し、構造化プルーニングにおける強 Lottery Ticket 仮説の最初の準指数関数的な境界を示しました。