Conditional Diffusion Guidance under Hard Constraint: A Stochastic Analysis Approach
本論文は、Doob の h 変換とマルティンゲール理論に基づき、事前学習済み拡散モデルのスコアネットワークを変更することなく、確率 1 で制約を満たす硬制約付き条件生成を実現するガイダンス手法と、その誤差解析およびオフポリシー学習アルゴリズムを提案するものである。
6584 件の論文
本論文は、Doob の h 変換とマルティンゲール理論に基づき、事前学習済み拡散モデルのスコアネットワークを変更することなく、確率 1 で制約を満たす硬制約付き条件生成を実現するガイダンス手法と、その誤差解析およびオフポリシー学習アルゴリズムを提案するものである。
この研究は、母親が社会的な批判を避けて育児の不安や罪悪感を解消するために、LLM を非審判的な情緒的支援ツールとして活用する傾向がある一方で、多くの母親は依然として人間の温かみを重視しており、LLM は人間の支援を代替するものではなく、社会的文脈に依存した低リスクな支援として位置づけるべきであることを示しています。
本論文は、従来の静的ベンチマークや手動レッドチームの限界を克服し、遺伝的プロンプト変異と階層的コーパス探索を統合した自律エージェントによるフィードバック駆動型最適化フレームワーク「NAAMSE」を提案し、大規模言語モデルの適応的な脅威に対する堅牢性をより現実的かつスケーラブルに評価する方法を示しています。
本論文は、衝突処理の課題を解決し、物理的に現実的な衣類のドレーピングを実現するために、明示的な力と制約条件を統合したハイブリッドなニューラル - 物理ソルバー「PhysDrape」を提案するものである。
本論文は、LLM を活用してポスト量子暗号(PQC)の C 参照コードを HLS 対応かつ合成可能なコードへ自動変換し、多段階の検証フローを通じて RTL 生成と検証を行う「LLM4PQC」というフレームワークを提案し、PQC ハードウェア設計における手作業の削減と設計空間探索の加速を実現することを示しています。
本論文は、V2X 協調知覚におけるドメイン適応の課題を解決するため、最適輸送理論に基づき冗長なサンプルをフィルタリングする手法と、意味情報の劣化を防ぐ段階的知識転送モジュールを組み合わせたパラメータ効率型フレームワーク「FlowAdapt」を提案し、学習可能パラメータを 1% に抑えながら最先端の性能を実現することを示しています。
本論文は、自律走行におけるマルチモーダル大規模言語モデルの計算コストを最大 30 倍削減しつつ、全トークンを使用した場合と同等の性能を維持する初の教師ありトークン削減フレームワーク「SToRM」を提案し、LangAuto ベンチマークで最先端の手法を上回る結果を示したものである。
本論文は、人間の介入に依存せずマルチモーダルエージェントを「意味的世界モデル」として活用し、物理的探索を構造化することでサンプル効率を大幅に向上させ、ロボット強化学習の自動化とスケーラビリティを実現する「エージェント誘導方策探索(AGPS)」フレームワークを提案しています。
本論文は、数学やコーディングなど複数のドメインにおける大規模言語モデルの強化学習(RLVR)において、混合マルチタスク学習と個別学習後のモデル結合の 2 つの手法を比較・分析し、ドメイン間の干渉が少なく相乗効果が得られることを示すとともに、その内部メカニズムを多角的に解明した研究です。
本論文は、LLM エージェントの推論時に知識を付与する「スキル」の効果を測定する新しいベンチマーク「SkillsBench」を提案し、手動で選定されたスキルがタスクの成功率を大幅に向上させる一方で、モデルが自律的に生成したスキルは平均的に効果がないことを示した。
本論文は、積分二次制約(IQC)とパラメータ依存リャプノフ関数を統合し、遅延依存状態フィードバック制御器を提案することで、状態遅延を伴う線形パラメータ可変(LPV)システムの安定性とゲイン性能を保証する新しい制御枠組みを確立したものである。
この論文は、コード埋め込みと意見動力学モデルを統合した新たな枠組みを提案し、オープンソースプロジェクトにおける開発者の協働パターンや合意形成のダイナミクスを定量的に分析する手法を提示しています。
本論文は、O-RAN 準拠の「遅延感知型 RIS オーケストレーター(DARIO)」を提案し、確率ネットワーク計算論に基づく遅延推定を用いて多 RIS 環境におけるユーザーごとの遅延・信頼性要件を効率的に満たすことで、6G の遅延敏感アプリケーションの性能を大幅に向上させることを示しています。
この論文は、グラフニューラルネットワークと構造を活用したモデル予測制御を統合し、GPU 並列処理による効率的な計算で高次元システム(例:ソフトロボット)のリアルタイム制御を実現するフレームワークを提案し、1,000 ノード規模での高速動作や実機における高精度な追従・障害物回避を実証したものである。
本論文は、2D 向けに設計されたマルチモーダル大規模言語モデル(MLLM)を 3D 医療画像解析に適用可能にするため、複雑なタスクを段階的に分解し構造化された記憶を活用する統合エージェント「3DMedAgent」を提案し、40 以上のタスクで既存手法を上回る性能を実証した研究です。
本論文は、自然言語で記述されたミッション要件と衛星画像からゼロショットで実行可能なコストマップを生成するモジュール型フレームワーク「OVerSeeC」を提案し、固定されたオントロジーに依存せず、未知の地形や複雑な優先順位付けに対応した自律航行のグローバル計画を可能にすることを示しています。
本論文は、ブルートゥース・ローエネルギーを用いた実機検証を通じて、低電力パーソナルエリアネットワークにおけるポスト量子鍵確立のエネルギーコストが暗号計算よりも通信に起因する割合が大きいことを明らかにし、量子耐性のある効率的なペアリングにはプロトコル設定と下位レイヤーの最適化が不可欠であることを示しています。
この論文は、有限一階世界におけるデフォルトと例外の帰納推論(ABD)を評価する新しいベンチマークを提案し、SMT 検証を用いた厳密な評価を通じて、最先端の LLM が妥当性は高いものの例外のスパース性(簡潔性)において課題を抱え、観察 regimes によって異なる一般化の失敗モードを示すことを明らかにしています。
この論文は、都市環境セグメンテーションにおける既知のドメインとカテゴリの両方を扱えない既存の課題を解決するため、新しい設定「OVDG-SS」とそのためのベンチマークを提案し、ドメインシフトによるテキスト - 画像相関の歪みを状態空間ベースの手法「S2-Corr」で補正することで、未知の環境とカテゴリに対するロバストなセグメンテーションを実現する手法を提示しています。
この論文は、拡張的にラベル付けされたターゲット述語を説明する単一の第一階述語論理式を生成するタスクとして、有限構造概念合成のためのベンチマーク「INDUCTION」を提案し、モデルの推論能力と汎化特性を評価する結果を報告しています。