cs.LG 件の論文 | Gist.Science

MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence

この論文は、Vygotsky の社会文化理論に基づき、IoT デバイスが自律的に概念ドリフト時に他デバイスからの知識を相互に援助し合う「MAcPNN」という新しい学習パラダイムを提案し、連続的進化的ニューラルネットワーク（cPNN）と量子化を用いてデータストリーム上の性能向上とメモリ削減を実現したことを示しています。

Federico Giannini, Emanuele Della ValleWed, 11 Ma🤖 cs.LG

Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach

本論文は、未知の擾乱分布を持つマルコフ決定過程に対して、経験分布からの距離関数の副レベル集合を曖昧集合として定義するデータ駆動型のロバストアプローチを提案し、その最適値関数が真の最適値関数に収束することや、有限サンプル数においてアウトオブサンプル性能の確率的な上界となることを証明しています。

Sivaramakrishnan RamaniWed, 11 Ma🤖 cs.LG

MAPLE: Elevating Medical Reasoning from Statistical Consensus to Process-Led Alignment

この論文は、医療分野における複雑な推論において多数決に依存する従来のテスト時強化学習の限界を克服するため、医学的プロセス報酬モデル（Med-RPM）と統合し、合意ではなく医学的正確さに基づく段階的報酬による新しいトレーニングパラダイム「MAPLE」を提案し、その有効性を複数のベンチマークで実証したものである。

Kailong Fan, Anqi Pu, Yichen Wu, Wanhua Li, Yicong Li, Hanspeter Pfister, Huafeng Liu, Xiang Li, Quanzheng Li, Ning GuoWed, 11 Ma🤖 cs.LG

Statistical Inference via Generative Models: Flow Matching and Causal Inference

この論文は、フローマッチングを中核的な例として生成 AI を統計的推論の文脈で再解釈し、欠損値補完や因果推論など、高次元の構造化問題における推論の妥当性を保ちつつ生成モデルを統合するための統計的枠組みを提案しています。

Shinto EguchiWed, 11 Ma🤖 cs.LG

The Coupling Within: Flow Matching via Distilled Normalizing Flows

本論文は、事前学習された正規化フロー（NF）モデルから導出されたカップリングを蒸留して学生モデルを訓練する「正規化フローマッチング（NFM）」を提案し、独立カップリングや最適輸送カップリングを用いた既存のフローモデルを凌駕する性能と、教師モデル自体の性能向上を実現することを示しています。

David Berthelot, Tianrong Chen, Jiatao Gu, Marco Cuturi, Laurent Dinh, Bhavik Chandna, Michal Klein, Josh Susskind, Shuangfei ZhaiWed, 11 Ma🤖 cs.LG

An accurate flatness measure to estimate the generalization performance of CNN models

この論文は、畳み込みニューラルネットワーク（CNN）の幾何学的構造を正確に反映し、クロスエントロピー損失のヘッシアン行列のトレースの閉形式解を導出することで、モデルの汎化性能を評価し、アーキテクチャや訓練の設計を支援する新たな平坦性指標を提案しています。

Rahman Taleghani, Maryam Mohammadi, Francesco MarchettiWed, 11 Ma🤖 cs.LG

When to Retrain after Drift: A Data-Only Test of Post-Drift Data Size Sufficiency

本論文は、概念ドリフト発生後の再学習に必要なデータサイズを推定し、安定した再学習のタイミングを決定するための、検出器やモデルに依存せずデータのみを用いた手法「CALIPER」を提案し、その理論的裏付けと実効性を示したものである。

Ren Fujiwara, Yasuko Matsubara, Yasushi SakuraiWed, 11 Ma🤖 cs.LG

Two Teachers Better Than One: Hardware-Physics Co-Guided Distributed Scientific Machine Learning

本論文は、広域センシングやリアルタイム処理における通信コストと物理法則の矛盾を解決するため、エッジデバイスでの軽量エンコーディングと物理意識デコーディングを組み合わせ、FWI タスクにおいて通信遅延を 8.9 倍、エネルギー消費を 33.8 倍削減しつつ、多くのケースで再構成精度を向上させる分散 SciML フレームワーク「EPIC」を提案するものである。

Yuchen Yuan, Junhuan Yang, Hao Wan, Yipei Liu, Hanhan Wu, Youzuo Lin, Lei YangWed, 11 Ma🤖 cs.LG

SCALAR: Learning and Composing Skills through LLM Guided Symbolic Planning and Deep RL Grounding

この論文は、LLM の計画と強化学習を双方向に結合し、RL の実行結果を LLM のスキル仕様にフィードバックして反復的に改善する「SCALAR」というフレームワークを提案し、Craftax 環境において既存手法を大幅に上回る性能を達成したことを報告するものです。

Renos Zabounidis, Yue Wu, Simon Stepputtis, Woojun Kim, Yuanzhi Li, Tom Mitchell, Katia SycaraWed, 11 Ma🤖 cs.LG

FlexServe: A Fast and Secure LLM Serving System for Mobile Devices with Flexible Resource Isolation

本論文は、ARM TrustZone の不十分なリソース分離によるオーバーヘッドを克服し、柔軟なメモリおよび NPU 保護メカニズムを導入することで、モバイル端末における大規模言語モデル（LLM）推論の高速化とセキュリティを両立させる「FlexServe」システムを提案し、従来手法と比較して大幅な性能向上を実現したことを示しています。

Yinpeng Wu, Yitong Chen, Lixiang Wang, Jinyu Gu, Zhichao Hua, Yubin XiaWed, 11 Ma🤖 cs.LG

From Days to Minutes: An Autonomous AI Agent Achieves Reliable Clinical Triage in Remote Patient Monitoring

この論文は、遠隔患者モニタリングで生成される膨大なデータを臨床スタッフが処理する課題を解決するため、自律型 AI エージェント「Sentinel」を開発し、従来の医師による監視を上回る感度とスケーラビリティで臨床的トリアージを可能にしたことを報告しています。

Sim2Act: Robust Simulation-to-Decision Learning via Adversarial Calibration and Group-Relative Perturbation

本論文は、意思決定に重要な領域におけるシミュレーションの誤差を敵対的較正で補正し、グループ相対摂動により方策学習を安定化させる「Sim2Act」というフレームワークを提案することで、ノイズやバイアスを含む実世界データから学習されたシミュレータを用いた堅牢な意思決定学習を実現するものである。

Hongyu Cao, Jinghan Zhang, Kunpeng Liu, Dongjie Wang, Feng Xia, Haifeng Chen, Xiaohua Hu, Yanjie FuWed, 11 Ma🤖 cs.AI

Quality over Quantity: Demonstration Curation via Influence Functions for Data-Centric Robot Learning

本論文は、ロボット学習におけるデータキュレーションの課題を解決するため、検証データへの損失削減への寄与を定量化するインフルエンス関数を用いて高品質なデモンストレーションを自動選別する「Quality over Quantity（QoQ）」という手法を提案し、シミュレーションおよび実世界での実験によりその有効性を示しています。

Haeone Lee, Taywon Min, Junsu Kim, Sinjae Kang, Fangchen Liu, Lerrel Pinto, Kimin LeeWed, 11 Ma🤖 cs.LG

Adaptive Active Learning for Online Reliability Prediction of Satellite Electronics

本論文は、データ不足や個体差といった課題を克服するため、ウィーナー過程に基づく劣化モデルと、空間配置やモデル不確実性を考慮した適応的能動学習を組み合わせた新たな衛星電子機器のオンライン信頼性予測枠組みを提案し、天宮宇宙ステーションの実用例を通じてその有効性を示しています。

Shixiang Li, Yubin Tian, Dianpeng Wang, Piao Chen, Mengying RenWed, 11 Ma🤖 cs.LG

Dynamic Multi-period Experts for Online Time Series Forecasting

この論文は、概念ドリフトを「再発ドリフト」と「新興ドリフト」に分類し、それぞれに対応する専門家の動的な組み合わせと不安定時の一般専門家への移行を通じて、オンライン時系列予測の適応性と精度を大幅に向上させる新しいハイブリッド枠組み「DynaME」を提案しています。

Seungha Hong, Sukang Chae, Suyeon Kim, Sanghwan Jang, Hwanjo YuWed, 11 Ma🤖 cs.LG

Learning Adaptive LLM Decoding

この論文は、推論時の計算リソースやタスクの難易度に応じてサンプリング戦略を動的に選択する軽量な適応デコーディングアダプタを強化学習で導入し、固定されたデコーディング手法よりも数学やコーディングタスクにおける精度とコストのトレードオフを大幅に改善することを提案しています。

Chloe H. Su, Zhe Ye, Samuel Tenka, Aidan Yang, Soonho Kong, Udaya GhaiWed, 11 Ma🤖 cs.LG

Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems

この論文は、コンタント・アシュビーの良き調節器定理、情報幾何学、およびアマリの定理といった確立された定理を用いて、ワルフラムの超グラフ物理学とバンチュリンの神経網宇宙論を統合し、因果不変な超グラフ基盤における持続的観測者が自然勾配学習に従うことを示し、観測者がフィッシャー計量の固有方向ごとに異なるバンチュリンのレジームに同時に存在し得ることを明らかにしています。

Max ZhuravlevWed, 11 Ma🤖 cs.LG

← 前へ次へ →

cs.LG