cs.LG 件の論文 | Gist.Science

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

本論文は、タスク固有のプromptと共有プromptの利点を統合し、スパースな混合専門家（MoE）アーキテクチャと動的な専門家選択メカニズムを導入することで、知識干渉を抑制しつつ計算コストとメモリ使用量を大幅に削減した継続学習フレームワーク「SMoPE」を提案し、既存手法を上回る性能を実証したものである。

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

この論文は、推論言語モデルの性能とコストのトレードオフを解決するため、心理測定学に触発された軽量で解釈可能なルーティングフレームワーク「RADAR」を提案し、質問の難易度とモデルの能力を学習して最適なモデル・予算ペアに動的にルーティングすることで、最先端の手法を上回る性能と汎化能力を実証しています。

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

Composer: A Search Framework for Hybrid Neural Architecture Design

本論文では、大規模な設計空間とトレーニングコストの課題を克服するため、小規模なモデル探索とスケーリング戦略を組み合わせたモジュール型ハイブリッドモデルアーキテクチャ検索フレームワーク「Composer」を提案し、Llama 3.2 を凌駕する高性能かつ効率的な新しいハイブリッド LLM アーキテクチャを発見したことを報告しています。

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu2026-03-12🤖 cs.LG

Uncovering Semantic Selectivity of Latent Groups in Higher Visual Cortex with Mutual Information-Guided Diffusion

この論文は、変分オートエンコーダと相互情報量に基づく拡散モデルを組み合わせた「MIG-Vis」という手法を提案し、マカク猿の側頭葉下側皮質（IT 野）の神経集団から抽出された潜在変数群が、物体の姿勢やカテゴリ間変換など明確な意味的特徴を選択的に符号化していることを実証したものである。

Yule Wang, Joseph Yu, Chengrui Li, Weihan Li, Anqi Wu2026-03-12🧬 q-bio

Communication Enables Cooperation in LLM Agents: A Comparison with Curriculum-Based Approaches

この論文は、マルチエージェント LLM における協調を促進する手段として、経験に基づくカリキュラム学習が設計次第で逆効果となる可能性があるのに対し、単純なコミュニケーションプロトコルの方がより信頼性の高い調整メカニズムであることを示しています。

Hachem Madmoun, Salem Lahlou2026-03-12🤖 cs.LG

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

この論文は、ウェアラブル EEG による睡眠ステージ分類において、ラベル不足を克服し臨床レベルの精度を達成するために、教師なし学習（SSL）を体系的に評価し、汎用モデルを上回るドメイン特化型パイプラインの有効性を実証したものである。

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

この論文は、地政学的ショックが直接デフォルトリスクを通じて、地経済的ショックが金融サイクルや政策期待を通じてそれぞれ異なる経路で主権リスクに影響を与える「ハサミ型」のパターンを、2018 年から 2025 年の 42 カ国のデータと機械学習を用いた分析によって実証し、両者のメカニズムの区別が流動性供給の効果範囲を決定づけることを明らかにしている。

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

この論文は、標準的な音声活動検出（VAD）モデルの特定の層に対してハイパーネットワークを用いてパーソナライズされた重みを生成する「HyWA」という手法を提案し、既存の条件付け手法と比較して精度の向上とアーキテクチャの再利用による展開の容易さを両立させることを示しています。

Mahsa Ghazvini Nejad, Hamed Jafarzadeh Asl, Amin Edraki, Mohammadreza Sadeghi, Masoud Asgharian, Yuanhao Yu, Vahid Partovi Nia2026-03-12⚡ eess

Reveal-to-Revise: Explainable Bias-Aware Generative Modeling with Multimodal Attention

本論文は、クロスモーダル注意機構、Grad-CAM++ による帰属分析、および「提示 - 修正」フィードバックループを統合した説明可能なバイアス意識生成フレームワークを提案し、マルチモーダル MNIST やファッション MNIST などのベンチマークにおいて、高い精度、ロバスト性、公平性を達成したことを示しています。

Noor Islam S. Mohammad, Md Muntaqim Meherab2026-03-12🤖 cs.LG

Absolute indices for determining compactness, separability and number of clusters

この論文は、クラスタリングのコンパクト性と分離性を評価し、真のクラスタ数を決定するための新しい絶対指標を提案し、合成データおよび実データを用いて既存の指標との比較を通じてその有効性を検証したものである。

Adil M. Bagirov, Ramiz M. Aliguliyev, Nargiz Sultanova, Sona Taheri2026-03-12📊 stat

Predicting kernel regression learning curves from only raw data statistics

この論文は、実世界のデータセットにおけるカーネル回帰の学習曲線を、データ共分散行列と目標関数の多項式分解という 2 つの統計量のみから予測する「エルミート固有構造仮説（HEA）」を提案し、その有効性を理論的・実験的に実証するとともに、MLP の学習過程における Hermite 多項式の獲得にも言及しています。

Dhruva Karkada, Joseph Turnbull, Yuxi Liu, James B. Simon2026-03-12🤖 cs.LG

Revisiting Value Iteration: Unified Analysis of Discounted and Average-Reward Cases

この論文は、幾何学的な解析を用いることで、割引報酬および平均報酬の両方の設定において、ユニークかつユニチェーンな最適政策を仮定すれば、価値反復法が従来の理論よりも高速な幾何学的収束を示すことを示しています。

Arsenii Mustafin, Xinyi Sheng, Dominik Baumann2026-03-12🤖 cs.LG

KV Cache Transform Coding for Compact Storage in LLM Inference

この論文は、LLM 推論における KV キャッシュの効率的な管理を実現するため、PCA による特徴量非相関化、適応量子化、エントロピー符号化を組み合わせた軽量な変換符号化器「KVTC」を提案し、推論精度を維持しつつ最大 20 倍（特定用途では 40 倍以上）の圧縮率を達成し、既存の手法を上回るメモリ効率化を実現することを示しています。

Konrad Staniszewski, Adrian Łancucki2026-03-12💬 cs.CL

Causal Regime Detection in Energy Markets With Augmented Time Series Structural Causal Models

この論文は、気象や発電構成などの要因と電力価格の複雑な因果関係を捉え、真の因果構造を学習して時系列データに反事実的推論を可能にする「拡張時系列因果モデル（ATSCM）」を提案し、再生可能エネルギーの異なるシナリオ下での価格予測などの新たな分析を可能にすることを示しています。

Dennis Thumm2026-03-12📊 stat

Towards Causal Market Simulators

この論文は、深生成モデルと構造的因果モデルを統合した時系列ニューラル因果モデル VAE（TNCM-VAE）を提案し、金融時系列データにおける因果関係と時間的依存性を維持しつつ、反事実的シナリオ分析やリスク評価を可能にする市場シミュレーターの開発を目指しています。

Dennis Thumm, Luis Ontaneda Mijares2026-03-12📊 stat

Resource Allocation in Hybrid Radio-Optical IoT Networks using GNN with Multi-task Learning

本論文は、エネルギー制約と部分的なチャネル観測性という現実的な条件下で、RF と光無線通信（OWC）を統合したハイブリッド IoT ネットワークのスケジューリング問題を解決するため、トランスフォーマーと組み合わせた双グラフ埋め込み多タスク学習フレームワーク「DGET」を提案し、従来の最適化手法に比べて計算複雑性を低減しつつ、Age of Information の改善と高い分類精度を実現することを示しています。

Aymen Hamrouni, Sofie Pollin, Hazem Sallouha2026-03-12🤖 cs.LG

STREAM-VAE: Dual-Path Routing for Slow and Fast Dynamics in Vehicle Telemetry Anomaly Detection

本論文は、自動車テレメトリデータに見られる「緩やかなドリフト」と「急激なスパイク」という異なる時間スケールの動的特性を、双経路エンコーダとデコーダを用いて明示的に分離することで、既存手法よりも頑健な異常検知を実現する「STREAM-VAE」を提案しています。

Kadir-Kaan Özer, René Ebeling, Markus Enzweiler2026-03-12🤖 cs.LG

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

本論文は、医療データにおけるプライバシー漏洩リスクに対処するため、医療概念の階層構造と幾何学的制約を統合し、特定知識の効率的な忘却と汎用医療能力の維持を両立させる階層的二重戦略のアンラーニング手法を提案し、MedMCQA や MHQA などのデータセットで高い忘却率と知識保持率を達成したことを示しています。

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

この論文は、SEC 提出書類や傷害報告などの業界標準データを Isaac Sim の物理シミュレーションと統合し、タスク成功だけでなく実世界の経済的採算性を評価する初の物理ベースのベンチマーク「CostNav」を提案し、既存の 7 つのナビゲーション手法がいずれも経済的に成立していないことを示しています。

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

Partially Equivariant Reinforcement Learning in Symmetry-Breaking Environments

この論文は、現実の環境で生じる局所的な対称性の破れによる誤差伝播を抑制しつつ、対称性の利点を維持するために、対称性が保たれる領域とそうでない領域でベルマンバックアップを適応的に使い分ける「部分的に不変な MDP（PI-MDP）」の枠組みと、それに基づく効率的で頑健な強化学習アルゴリズム（PE-DQN、PE-SAC）を提案し、多様なベンチマークでその有効性を示しています。

Junwoo Chang, Minwoo Park, Joohwan Seo, Roberto Horowitz, Jongmin Lee, Jongeun Choi2026-03-12🤖 cs.LG

← 前へ次へ →