MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence
この論文は、Vygotsky の社会文化理論に基づき、IoT デバイスが自律的に概念ドリフト時に他デバイスからの知識を相互に援助し合う「MAcPNN」という新しい学習パラダイムを提案し、連続的進化的ニューラルネットワーク(cPNN)と量子化を用いてデータストリーム上の性能向上とメモリ削減を実現したことを示しています。
2295 件の論文
この論文は、Vygotsky の社会文化理論に基づき、IoT デバイスが自律的に概念ドリフト時に他デバイスからの知識を相互に援助し合う「MAcPNN」という新しい学習パラダイムを提案し、連続的進化的ニューラルネットワーク(cPNN)と量子化を用いてデータストリーム上の性能向上とメモリ削減を実現したことを示しています。
本論文は、未知の擾乱分布を持つマルコフ決定過程に対して、経験分布からの距離関数の副レベル集合を曖昧集合として定義するデータ駆動型のロバストアプローチを提案し、その最適値関数が真の最適値関数に収束することや、有限サンプル数においてアウトオブサンプル性能の確率的な上界となることを証明しています。
この論文は、医療分野における複雑な推論において多数決に依存する従来のテスト時強化学習の限界を克服するため、医学的プロセス報酬モデル(Med-RPM)と統合し、合意ではなく医学的正確さに基づく段階的報酬による新しいトレーニングパラダイム「MAPLE」を提案し、その有効性を複数のベンチマークで実証したものである。
この論文は、フローマッチングを中核的な例として生成 AI を統計的推論の文脈で再解釈し、欠損値補完や因果推論など、高次元の構造化問題における推論の妥当性を保ちつつ生成モデルを統合するための統計的枠組みを提案しています。
本論文は、事前学習された正規化フロー(NF)モデルから導出されたカップリングを蒸留して学生モデルを訓練する「正規化フローマッチング(NFM)」を提案し、独立カップリングや最適輸送カップリングを用いた既存のフローモデルを凌駕する性能と、教師モデル自体の性能向上を実現することを示しています。
この論文は、畳み込みニューラルネットワーク(CNN)の幾何学的構造を正確に反映し、クロスエントロピー損失のヘッシアン行列のトレースの閉形式解を導出することで、モデルの汎化性能を評価し、アーキテクチャや訓練の設計を支援する新たな平坦性指標を提案しています。
本論文は、概念ドリフト発生後の再学習に必要なデータサイズを推定し、安定した再学習のタイミングを決定するための、検出器やモデルに依存せずデータのみを用いた手法「CALIPER」を提案し、その理論的裏付けと実効性を示したものである。
本論文は、広域センシングやリアルタイム処理における通信コストと物理法則の矛盾を解決するため、エッジデバイスでの軽量エンコーディングと物理意識デコーディングを組み合わせ、FWI タスクにおいて通信遅延を 8.9 倍、エネルギー消費を 33.8 倍削減しつつ、多くのケースで再構成精度を向上させる分散 SciML フレームワーク「EPIC」を提案するものである。
この論文は、LLM の計画と強化学習を双方向に結合し、RL の実行結果を LLM のスキル仕様にフィードバックして反復的に改善する「SCALAR」というフレームワークを提案し、Craftax 環境において既存手法を大幅に上回る性能を達成したことを報告するものです。
本論文は、ARM TrustZone の不十分なリソース分離によるオーバーヘッドを克服し、柔軟なメモリおよび NPU 保護メカニズムを導入することで、モバイル端末における大規模言語モデル(LLM)推論の高速化とセキュリティを両立させる「FlexServe」システムを提案し、従来手法と比較して大幅な性能向上を実現したことを示しています。
この論文は、遠隔患者モニタリングで生成される膨大なデータを臨床スタッフが処理する課題を解決するため、自律型 AI エージェント「Sentinel」を開発し、従来の医師による監視を上回る感度とスケーラビリティで臨床的トリアージを可能にしたことを報告しています。
本論文は、意思決定に重要な領域におけるシミュレーションの誤差を敵対的較正で補正し、グループ相対摂動により方策学習を安定化させる「Sim2Act」というフレームワークを提案することで、ノイズやバイアスを含む実世界データから学習されたシミュレータを用いた堅牢な意思決定学習を実現するものである。
本論文は、ロボット学習におけるデータキュレーションの課題を解決するため、検証データへの損失削減への寄与を定量化するインフルエンス関数を用いて高品質なデモンストレーションを自動選別する「Quality over Quantity(QoQ)」という手法を提案し、シミュレーションおよび実世界での実験によりその有効性を示しています。
本論文は、データ不足や個体差といった課題を克服するため、ウィーナー過程に基づく劣化モデルと、空間配置やモデル不確実性を考慮した適応的能動学習を組み合わせた新たな衛星電子機器のオンライン信頼性予測枠組みを提案し、天宮宇宙ステーションの実用例を通じてその有効性を示しています。
この論文は、概念ドリフトを「再発ドリフト」と「新興ドリフト」に分類し、それぞれに対応する専門家の動的な組み合わせと不安定時の一般専門家への移行を通じて、オンライン時系列予測の適応性と精度を大幅に向上させる新しいハイブリッド枠組み「DynaME」を提案しています。
この論文は、推論時の計算リソースやタスクの難易度に応じてサンプリング戦略を動的に選択する軽量な適応デコーディングアダプタを強化学習で導入し、固定されたデコーディング手法よりも数学やコーディングタスクにおける精度とコストのトレードオフを大幅に改善することを提案しています。
この論文は、コンタント・アシュビーの良き調節器定理、情報幾何学、およびアマリの定理といった確立された定理を用いて、ワルフラムの超グラフ物理学とバンチュリンの神経網宇宙論を統合し、因果不変な超グラフ基盤における持続的観測者が自然勾配学習に従うことを示し、観測者がフィッシャー計量の固有方向ごとに異なるバンチュリンのレジームに同時に存在し得ることを明らかにしています。
この論文は、トークンの自己位置情報を排除して文脈モデルリングを強化する「排他的自己注意(XSA)」を提案し、大規模言語モデルにおいて標準的な自己注意よりも一貫して優れた性能を示すことを実証しています。
本論文は、動的な車載環境における遅延低減を目的として、再構成可能インテリジェント表面(RIS)と意味通信を統合し、近接方策最適化(PPO)と線形計画法(LP)を組み合わせたハイブリッド最適化手法を提案し、既存手法と比較してエンドツーエンドの遅延を約 40〜50% 削減できることを示しています。
この論文は、Qwen3 微調整モデルを用いて英語と中国語のニュースから抽出したセンチメントデータを、LSTM モデルに統合することで、特に市場変動が激しい時期においてアルミニウム価格の予測精度と経済的有用性が大幅に向上することを示しています。