DreamSAC: Learning Hamiltonian World Models via Symmetry Exploration
DreamSAC は、ハミルトニアンに基づく好奇心ボーナスを用いた対称性探索戦略と、生データから物理的保存則を学習する自己教師ありコントラスト学習を組み合わせた世界モデルを導入することで、統計的相関ではなく物理法則を習得し、未知の物理特性への外挿一般化を飛躍的に向上させる手法を提案しています。
11488 件の論文
DreamSAC は、ハミルトニアンに基づく好奇心ボーナスを用いた対称性探索戦略と、生データから物理的保存則を学習する自己教師ありコントラスト学習を組み合わせた世界モデルを導入することで、統計的相関ではなく物理法則を習得し、未知の物理特性への外挿一般化を飛躍的に向上させる手法を提案しています。
この論文は、単一橋梁のモデルを拡張した複合橋梁ネットワークのメンテナンスにおいて、強化学習で得られた方策をPRISM言語で記述し、確率的モデル検査と説明可能性手法を用いて安全性保証と解釈性を検証する「COOL-MC」というツールの有効性を示しています。
PTB-XL データセットを用いた心電図分類において、複雑なアーキテクチャに頼らず、データの前処理とクラスバランス調整を重視した簡素化された CNN-VAE モデルが、少数パラメータで競合する性能を達成し、医療信号分類におけるデータ中心アプローチの重要性を実証しました。
この論文は、生成・再構成・識別の 3 要素と関心領域(ROI)アテンション機構を組み合わせた GRD-Net を提案し、不良検出における従来のポストプロセッシング依存を排除し、MVTec データセットや製薬業界の実際のデータを用いた実用的な異常検出と欠陥局所化を実現する手法を述べています。
本論文は、過学習防止や転移学習の適用、ターゲットデータを用いない閾値調整、偏った事前確率、および再現性の考慮など現実的な条件を踏まえてLiRA攻撃を再評価した結果、従来報告されていたよりも攻撃効率が大幅に低下し、プライバシー監査にはより現実的な評価プロトコルが必要であることを示しています。
本論文は、車両経路問題(VRP)の制約を離散ノイズグラフ拡散モデルで学習し、これを自己回帰ソルバーに統合して多様な問題分布や長期的な意思決定において既存手法を凌駕する性能を実現する新しい生成ニューラルソルバーを提案し、CVRPlib における大規模な実験で最先端の結果を示したものである。
本論文は、画像分類における分布外(OOD)検出の性能を評価するため、クロスエントロピー損失、プロトタイプ損失、トリプレット損失、平均精度損失の 4 つの代表的な学習目的関数を OpenOOD 基準で体系的に比較し、クロスエントロピー損失が全体的に最も一貫した OOD 検出性能を示すことを明らかにしています。
本論文は、時系列信号、周波数領域画像、テキスト知識を統合的にモデル化し、産業用設備の予知保全における時系列ビッグデータ分析の精度と汎化性能を飛躍的に向上させる新しいマルチモーダル大規模言語モデルフレームワーク「TS-MLLM」を提案するものである。
本論文は、医薬品製造のブロー・フィル・シーリング(BFS)ラインにおける高速なオンライン異常検出を実現するため、正常サンプルのみで学習する生成敵対的アーキテクチャに基づく半教師ありフレームワークを提案し、500ms の時間制約内で高精度な検出と局所化を達成したことを報告しています。
この論文は、実録音からのピッチ適応スペクトル分析とパラメトリック合成を組み合わせた分析駆動型フレームワークを提案し、サンプル単位のRPMおよびトルク注釈を備えた大規模なエンジン音合成データセット「Procedural Engine Sounds Dataset」を構築・公開し、自動車音響設計やデータ駆動型合成研究を支援することを目的としています。
この論文は、大規模視覚言語モデル(LVLM)が個別には安全に見える視覚的スロットを構造的に組み合わせて有害な出力を生成する新たな脆弱性を発見し、これを悪用した単一クエリによる「StructAttack」という新しい脱獄フレームワークを提案したものである。
この論文は、推論コストを削減しつつ回答の品質を維持するため、問題の難易度に応じて推論部分と回答部分を分離し、それぞれに適切な強化学習信号を適用する「Difficulty-Scaled Segment-Wise GRPO(DSS-GRPO)」を提案しています。
本論文は、メタ転移学習を活用して神経スパイク波形の非一様圧縮と少数ショット分類を同時に処理し、生体実験で高い性能を示した「MetaSort」と呼ばれる新規アルゴリズムを提案しています。
この論文は、微分可能な真理値表と新しい soft TopK 演算子を用いて、高い予測性能と低い複雑さを両立し、かつ DNF/CNF ブール論理式として完全に解釈可能なスパースなルールモデル「TT-Sparse」を提案し、28 のデータセットで既存の最先端手法を上回る性能を実証しています。
本論文は、Kubernetes 環境におけるビジネスポリシーとリソースプロビジョニングの乖離による課題を解決するため、戦略・計画・実行の 3 層構造を持つ階層型マルチエージェントシステム「MAS-H2」を提案し、その実証実験において従来の自動スケーリング手法と比較してリソース効率の大幅な向上とゼロダウンタイム移行を実現したことを報告しています。
この論文は、凍結された視覚生成モデルに低ランク適応を付加して信号を関数として符号化する新たな枠組みを提案し、これにより極低ビットレートでの高品質な動画圧縮を実現するとともに、圧縮と生成を統合する新たなアプローチを示しています。
本論文は、人間の運動適応の段階的な性質を反映した「段階的マルチエージェント訓練(SMAT)」を提案し、シミュレーションおよび実機実験を通じて、ユーザーごとの再訓練なしに一貫した支援と正味の機械的パワーを実現するコ適応型外骨格制御の成功を示しています。
この論文は、拡散モデルの推論における高いエネルギー消費と計算負荷という課題に対し、シリコンフォトニクス技術を用いた新しいアクセラレータを提案し、最先端の加速器と比較して少なくとも 3 倍のエネルギー効率と 5.5 倍のスループット向上を実現したことを報告しています。
この論文は、強化学習を用いて生物学的関節モーメントを低減する外骨格制御ポリシーを学習し、オープンソースの歩行データセットを用いた検証パイプラインによって、シミュレーションで訓練された制御ネットワークが生物学的関節モーメントと高い一致を示すことを実証するとともに、シミュレーションから実世界への転移における可能性と課題を明らかにしたものである。
本論文は、大規模言語モデルの推論能力を活用し、文脈学習による多様な候補解の探索と強化学習による反復的な方策改善を統合した階層的進化強化学習フレームワーク「HELIX」を提案し、円のパッキング問題や機械学習ベンチマークにおいて最先端の成果を達成したことを報告するものである。