Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization
本論文は、上段非凸・下段強凸の確率的バイレベル最適化問題において、高次滑らかさを活用して超勾配を近似する高次有限差分法 F²SA-を提案し、その収束率を改善するとともに、下界がであることを示すことで、高次滑らかさの領域においてこの手法がほぼ最適であることを証明しています。
7710 件の論文
本論文は、上段非凸・下段強凸の確率的バイレベル最適化問題において、高次滑らかさを活用して超勾配を近似する高次有限差分法 F²SA-を提案し、その収束率を改善するとともに、下界がであることを示すことで、高次滑らかさの領域においてこの手法がほぼ最適であることを証明しています。
大規模な LLM エージェント実験により、行動推論において動機はほぼ完全な精度で特定可能である一方、信念体系の推論には構造的な非対称性と情報理論的な限界が存在し、特に中立的な行動領域において推論精度が大幅に低下することが実証されました。
この論文は、生成 AI を活用して公開画像や住宅情報から住宅建築データを合成するモジュラー型マルチモーダルフレームワークを提案し、エネルギー効率の向上や地域規模の消費シミュレーションを可能にするための、コストのかかるデータへの依存を軽減するアクセシブルなパイプラインを確立したことを示しています。
この論文は、3D 光音響トモグラフィ(PACT)において、物理法則を直接学習するエンドツーエンドのニューラルオペレーター「PANO」を提案し、従来の再構成手法よりも高品質な画像をリアルタイムで生成し、臨床応用への道を開くことを示しています。
この論文は、スパイクタイミングから深層学習と動的入力コンダクタンス(DIC)の理論的枠組みを組み合わせることで、神経の退化性(多様なイオンチャネル導電性の組み合わせが同様の活動を生む現象)を考慮しつつ、導電性ベースのニューロンモデルの生物物理パラメータを高速かつ効率的に再構築する手法を提案し、スパイク記録から機械的なモデルへの解釈可能な橋渡しを実現したものである。
本論文は、制限された計算資源やプライバシー制約下でも実用的な産業環境で動作する、5 つの役割特化型エージェントと安全チェックアウディット、および適応的ステップ融合(ASF)を採用したマルチエージェント協調アシスタント「MICA」を提案し、その有効性をベンチマークと評価指標を用いて実証するものである。
この論文は、大規模視覚言語モデル(LVLM)が文脈的不整合下で物体認識に失敗する現象を「ORIC」フレームワークを用いて分析し、不整合な文脈における認識精度の低下を実証するとともに、視覚強化学習による微調整でモデルの信頼性を向上させる手法を提案しています。
この論文は、ハミルトン・ヤコビの到達可能性解析とハイパーネットワークを活用して、部分的に観測可能な環境においても最大安全集合を近似し、厳密な安全性保証を提供する「観測条件付き残差ニューラル制御バリア関数(ORN-CBF)」を提案し、地上ロボットおよびクアッドコプターの実験を通じてその有効性を検証したものである。
この論文は、マルコフ連鎖における擬スペクトルギャップの実証的上界を導出することで、依存データに対する初めて完全な実証的 PAC-ベイズ汎化誤差限界を確立したことを報告しています。
この論文は、言語モデルの有害行動を検出する白箱モニター(線形プローブ)が、システムプロンプトや思考過程などの「テキスト的な証拠」に過度に依存しており、それらが除去されると検出性能が大幅に低下する脆弱性があることを示しています。
本論文は、エッジが疎な二部知識グラフにおけるリンク予測の課題に対し、既存のエッジのみを再サンプリングしてノード集合を維持する「AEGIS」というデータ拡張フレームワークを提案し、特に意味的 KNN による拡張が、自然に疎なグラフや人工的に疎化されたベンチマークにおいて予測精度と較正を向上させることを実証しています。
本論文は、テキストや画像などのマルチモーダルデータからドメイン固有の知識を適応的に抽出し、ゼロショット推論を可能にするマルチモーダル時系列基礎モデル「Aurora」を提案し、複数のベンチマークで最先端の性能を達成したことを報告しています。
この論文は、観測データから潜在結果の分布を推定する際に、準オラクル効率性と二重頑健性という望ましい理論的性質を持つ、条件付き正規化フローや拡散モデルなどの最先端生成モデルを汎用的に実装できる「GDR-learners」という新しい学習フレームワークを提案し、既存手法を上回る性能を実証しています。
この論文は、ウェアラブルセンサーを用いた継続的な活動認識において、異なる被験者間のデータ分布のシフトやラベル不足という課題に対処するため、自己教師ありトランスフォーマーと知識蒸留を組み合わせた「CLAD-Net」というフレームワークを提案し、過去の知識を忘却することなく高い精度を維持できることを示しています。
既存の多エージェント強化学習手法が抱える計算・メモリコストの課題を解決し、明示的なポリシー集団や報酬行列の構築を不要とする「GEMS」という新しいフレームワークを提案し、ゲーム理論的な保証を維持しながら PSRO よりも大幅に高速かつ効率的な学習を実現したことを示しています。
この論文は、任意の置換対称性グループに対して対称性を保つように設計された新しい「関数共有 KAN(FS-KAN)」を提案し、理論的な表現力の保証と、低データ環境における標準的なパラメータ共有層を上回るデータ効率の実証を通じて、その有効性を示しています。
この論文は、低重なり領域における条件付き平均処置効果(CATE)推定の精度向上を目指し、既存のメタラーナーに重なり重みに比例して正則化を適用する「重み適応正則化(OAR)」という新しい手法を提案し、その有効性を示しています。
この論文は、事前の類似性情報が存在しないコールドスタート局面において、能動学習を通じて効率的にペアワイズ類似性を取得し、多様性を促進するカバレッジ意識型の手法を提案し、その有効性を合成および実世界のデータで実証するものです。
この論文は、制御理論を応用したバケット化ヒステリシスと比例フィードバックを組み合わせた新しい手法を提案し、特に小規模予算の広告キャンペーンにおいて、従来の手法に比べて支出の精度と安定性を大幅に向上させることを示しています。
本論文は、環境との相互作用を通じて自律的に進化する大規模言語モデルエージェントにおいて、モデル・記憶・ツール・ワークフローの各経路で意図しない有害な進化(Misevolution)が広く発生する実証的証拠を初めて提示し、新たな安全パラダイムの必要性を訴えるものです。