cs.LG 件の論文 | Gist.Science

GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification

GATech チームは、AbjadGenEval 共有タスクにおいて、複雑なプーリング手法よりも単純な平均プーリングの方が限られたデータで安定して良好な結果（F1 0.75）を示し、さらに人間による文章が機械生成された文章よりも有意に長いというデータ特性を明らかにしました。

Ahmed Khaled Khamis2026-03-12💬 cs.CL

GATech at AbjadMed: Bidirectional Encoders vs. Causal Decoders: Insights from 82-Class Arabic Medical Classification

この論文は、82 クラスの阿拉伯語医療テキスト分類タスクにおいて、因果的デコーダー（大規模言語モデル）よりも、ハイブリッドプーリングやマルチサンプルドロップアウトを備えた微調整済みの双方向エンコーダー（AraBERTv2）の方が、正確な意味境界の捕捉と分類精度において優れていることを実証しています。

Ahmed Khaled Khamis2026-03-12💬 cs.CL

Personalized Group Relative Policy Optimization for Heterogenous Preference Alignment

この論文は、標準的な GRPO が抱える「全サンプルを交換可能と仮定する」限界を克服し、各ユーザーの選好グループに固有の報酬履歴に基づいて利得を正規化することで、多様な個人選好への迅速かつ高精度なアライメントを実現する「Personalized GRPO（P-GRPO）」という新たなフレームワークを提案し、その有効性を示したものです。

Jialu Wang, Heinrich Peters, Asad A. Butt, Navid Hashemi, Alireza Hashemi, Pouya M. Ghari, Joseph Hoover, James Rae, Morteza Dehghani2026-03-12🤖 cs.LG

Defining AI Models and AI Systems: A Framework to Resolve the Boundary Problem

本論文は、AI モデルと AI システムの境界の曖昧さが規制上の義務分担に課題を生んでいる現状を踏まえ、学術文献や規制文書の大規模レビューに基づき、両者の概念を明確に定義し、規制実装における責任の所在を解決するための枠組みを提案するものである。

Yuanyuan Sun, Timothy Parker, Lara Gierschmann, Sana Shams, Teo Canmetin, Mathieu Duteil, Rokas Gipiškis, Ze Shen Chin2026-03-12🤖 cs.AI

LWM-Temporal: Sparse Spatio-Temporal Attention for Wireless Channel Representation Learning

LWM-Temporal は、物理的に妥当な近傍に相互作用を制限することで計算複雑度を大幅に削減しつつ、モビリティに起因する進化を捉える汎用的な無線チャネル埋め込みを学習する、新しい大規模無線モデル（LWM）ファミリーのメンバーです。

Sadjad Alikhani, Akshay Malhotra, Shahab Hamidi-Rad, Ahmed Alkhateeb2026-03-12🤖 cs.LG

HTM-EAR: Importance-Preserving Tiered Memory with Hybrid Routing under Saturation

本論文は、長期実行エージェントの文脈制限下で重要な情報を保持しつつ不要な情報を効率的に忘却するための階層型メモリ管理手法「HTM-EAR」を提案し、重要性に基づくエビクションとハイブリッドルーティングを組み合わせることで、飽和状態においてもオラクルに近い検索精度を維持できることを実証しています。

Shubham Kumar Singh2026-03-12🤖 cs.AI

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

本論文は、スマートホームの IoT 環境において、ラベル不要の自己教師あり学習と軽量トランスフォーマーを活用し、複数の故障や居住者が混在する状況下でも高精度かつエッジデバイス上で動作可能なセンサー故障検出・特定手法「Tureis」を提案するものである。

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

本論文は、NetSecGame 環境において IP アドレスの再割り当てという単純な変化が自律攻撃エージェントの一般化能力に与える影響を評価し、メタ学習エージェントは部分的な適応を示すものの、推論コストや透明性の欠如などの課題はあるものの、事前学習済み LLM ベースのエージェントが保持されたテスト条件下で最も高い成功率を達成したことを明らかにしています。

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

大規模な制御実験により、言語モデルの安全性評価において「構造化されたプロンプト（スケフォールディング）」そのものよりも「評価形式（多肢選択か自由記述か）」がスコアに与える影響が圧倒的に大きく、かつモデルと構成の組み合わせによって安全性の増減が逆転するため、個別のモデルと設定ごとのテストが不可欠であることが示されました。

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

IoT 環境におけるヒト活動認識の継続的学習において、事前学習済みモデルの凍結とチャネル単位のゲート制御による特徴選択アプローチを採用することで、パラメータの 2% 未満のみを学習しながら忘却を大幅に抑制し、安定性と可塑性を両立する効率的なフレームワークを提案しています。

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

本論文は、Sharpness-Aware Minimization (SAM) の従来手法における理論的解釈の欠如と近似精度の問題を解決し、最大値の方向を明示的に推定する新たな手法「XSAM」を提案し、その有効性を示すものである。

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

本論文は、組み合わせ融合分析（CFA）の手法を統合し、PyTorch、TensorFlow、Scikit-learn のワークフローに対応する新しい Python ツール「InFusionLayer」を提案し、コンピュータビジョンデータセットにおけるその有効性を検証したものである。

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

本論文は、暗号化トラフィック分類においてバイト列への平坦化がもたらす意味論的ミスマッチを解決するため、プロトコル定義のフィールド意味をアーキテクチャの事前知識として活用し、予測可能性に基づくフィルタリングや双軸アテンションを備えた表形式のマスクオートエンコーダ「FlowSem-MAE」を提案し、限られたラベル付きデータでも最先端の性能を達成することを示しています。

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

OmniGuide は、3D 空間における微分可能なエネルギー関数として任意のガイダンス源を表現し、VLA モデルの行動サンプリングを誘導することで、複雑なタスクにおける汎用ロボット政策の成功率と安全性を大幅に向上させる柔軟なフレームワークを提案するものです。

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

Cluster-Aware Attention-Based Deep Reinforcement Learning for Pickup and Delivery Problems

本論文は、ピックアップ・デリバリー問題のクラスター構造を明示的に活用するクラスター認識型アテンション機構と階層的デコーディングを組み合わせた深層強化学習フレームワーク「CAADRL」を提案し、最先端手法と同等またはそれ以上の性能を、大幅に短い推論時間で達成することを示しています。

Wentao Wang, Lifeng Han, Guangyu Zou2026-03-12🤖 cs.LG

Quantization of Ricci Curvature in Information Geometry

この論文は、情報幾何学におけるフィッシャー情報計量に基づくリッチスカラーの体積平均が半整数に量子化されるという 20 年前の予想を、木構造や完全グラフでは証明し、一般のループ構造では反証することで解決するとともに、ガウス DAG ネットワークにおける正負の曲率の二項対立を示しています。

Carlos C. Rodriguez2026-03-12🔢 math

Training Language Models via Neural Cellular Automata

この論文は、ニューラルセルラオートマトン（NCA）を用いて生成した合成データを事前学習に活用することで、自然言語データのみでの学習よりも効率的に言語モデルの性能を向上させ、推論タスクにおける汎化能力も高めることを示しています。

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

本論文は、Muon 学習アルゴリズムの重みスペクトルが過度に正規化される問題を Heavy-Tailed Self-Regularization 理論に基づいて解決し、LLM の事前学習や画像分類において最先端の性能を達成する「HTMuon」という新しい最適化手法を提案するものである。

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

Improving Search Agent with One Line of Code

この論文は、検索エージェントの学習における重要なサンプリング分布のドリフト問題に対処し、既存の GRPO アルゴリズムをわずか 1 行のコード修正で KL 制約を適用する「SAPO」を提案することで、モデルの崩壊を防ぎ、QA ベンチマークで大幅な性能向上を実現したことを報告しています。

Jian Li, Dongsheng Chen, Zhenhua Xu, Yizhang Jin, Jiafu Wu, Chengjie Wang, Xiaotong Yuan, Yabiao Wang2026-03-12🤖 cs.LG

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

本論文は、時系列基盤モデル Chronos-T5-Large にスパースオートエンコーダを適用した初の研究であり、中間エンコーダ層に存在する「変化検知」機能が予測精度に最も因果的に重要であることを、392 回にわたる単一特徴量アブレーション実験を通じて実証しています。

Anurag Mishra2026-03-12🤖 cs.LG

← 前へ次へ →