cs.LG 件の論文 | Gist.Science

Continuous-Flow Data-Rate-Aware CNN Inference on FPGA

この論文は、畳み込みニューラルネットワーク（CNN）のプーリング層やストライドが 1 より大きい層におけるデータ量減少によるハードウェア利用率の低下を解消し、信号のインターリーブやハードウェアユニットの共有、適切な並列化によって MobileNet などの複雑な CNN を単一の FPGA 上で高スループットかつ高効率に推論できる、データレートに配慮した連続フロー型アーキテクチャを提案するものである。

Tobias Habermann, Michael Mecik, Zhenyu Wang, César David Vera, Martin Kumm, Mario Garrido2026-03-10🤖 cs.LG

MeanCache: From Instantaneous to Average Velocity for Accelerating Flow Matching Inference

本論文は、瞬間速度ではなく平均速度の視点を導入し、キャッシュされたヤコビ行列 - ベクトル積を活用して局所誤差の蓄積を抑制するトレーニング不要の「MeanCache」フレームワークを提案し、FLUX.1 や HunyuanVideo などの大規模生成モデルにおいて、画質を維持しつつ最大 4.56 倍の推論高速化を実現することを示しています。

Huanlin Gao, Ping Chen, Fuyuan Shi, Ruijia Wu, Li YanTao, Qiang Hui, Yuren You, Ting Lu, Chao Tan, Shaoan Zhao, Zhaoxiang Liu, Fang Zhao, Kai Wang, Shiguo Lian2026-03-10🤖 cs.LG

PASS: Certified Subset Repair for Classical and Quantum Pairwise Constrained Clustering

PASS は、ペアワイズ制約付き k-means クラスタリングの最適化を小規模な部分集合に集中させることで、大規模問題や量子・ハイブリッドアプローチにおける計算コストを削減し、制約違反をリスト彩色問題として形式化して修復可能にするスケーラブルなフレームワークです。

Pedro Chumpitaz-Flores, My Duong, Ying Mao, Kaixun Hua2026-03-10🤖 cs.LG

Model-Free Neural State Estimation in Nonlinear Dynamical Systems: Comparing Neural and Classical Filters

この論文は、システム方程式へのアクセスなしにデータのみから学習するモデルフリーのニューラルネットワーク（特に状態空間モデル）が、非線形ダイナミクスにおける状態推定において、古典的なフィルタに匹敵する性能を発揮しながらも、はるかに高い推論スループットを実現することを示す体系的な実証比較を行っている。

Zhuochen Liu, Hans Walker, Rahul Jain2026-03-10🤖 cs.LG

TimeSliver : Symbolic-Linear Decomposition for Explainable Time Series Classification

この論文は、時系列データの各時間区間の寄与を線形に符号化する新しい解釈可能深層学習フレームワーク「TimeSliver」を提案し、合成および実世界の多変量時系列データセットにおいて既存の時間的帰属手法を大幅に上回る説明性能と、最先端の予測精度を両立させることを示しています。

Akash Pandey, Payal Mohapatra, Wei Chen, Qi Zhu, Sinan Keten2026-03-10🤖 cs.LG

Transferable Graph Condensation from the Causal Perspective

この論文は、因果不変性を活用してドメインやタスクを超えて転送可能なグラフデータ凝縮手法「TGCC」を提案し、既存手法よりも優れた性能を実現することを示しています。

Huaming Du, Yijie Huang, Su Yao, Yiying Wang, Yueyang Zhou, Jingwen Yang, Jinshi Zhang, Han Ji, Yu Zhao, Guisong Liu, Hegui Zhang, Carl Yang, Gang Kou2026-03-10🤖 cs.LG

FlowSymm: Physics Aware, Symmetry Preserving Graph Attention for Network Flow Completion

本論文は、交通やエネルギーなどのネットワークにおいて欠落する流量を局所保存則を厳密に満たしつつ復元するための、対称性を保持するグラフ注意機構と最小ノルム補完、および陰的二階最適化によるティコノフ微調整を組み合わせた新しいアーキテクチャ「FlowSymm」を提案し、実世界データセットにおいて既存手法を上回る精度を達成したことを報告しています。

Ege Demirci, Francesco Bullo, Ananthram Swami, Ambuj Singh2026-03-10🤖 cs.LG

Mem-T: Densifying Rewards for Long-Horizon Memory Agents

Mem-T は、長期にわたる記憶操作におけるスパースな報酬という課題を解決するため、木構造のバックプロパゲーションとヒンズサイト・クレジット割り当てを用いて段階的な密な報酬を生成する強化学習フレームワーク「MoT-GRPO」を提案し、記憶管理と検索の両方を最適化する自律型記憶エージェントを実現しています。

Yanwei Yue, Boci Peng, Xuanbo Fan, Jiaxin Guo, Qiankun Li, Yan Zhang2026-03-10🤖 cs.LG

Bitcoin Price Prediction using Machine Learning and Combinatorial Fusion Analysis

この論文は、ランクとスコアの組み合わせおよび認知的多様性を活用した「組合せ融合分析（CFA）」という新しいモデル融合手法をビットコイン価格予測に応用し、MAPE 0.19% という優れた性能で既存の個別モデルや他の予測手法を上回る結果を示したことを報告しています。

Yuanhong Wu, Wei Ye, Jingyan Xu, D. Frank Hsu2026-03-10🤖 cs.LG

In-Run Data Shapley for Adam Optimizer

この論文は、従来の SGD ベースの手法では Adam 最適化器の複雑な動的挙動を捉えられないという課題を解決するため、固定状態仮説に基づく閉形式近似と「線形化ゴースト近似」を導入し、Adam 最適化器に対応した高速かつ高精度なデータ寄与度評価手法「Adam-Aware In-Run Data Shapley」を提案するものである。

Meng Ding, Zeqing Zhang, Di Wang, Lijie Hu2026-03-10🤖 cs.LG

Do Schwartz Higher-Order Values Help Sentence-Level Human Value Detection? A Study of Hierarchical Gating and Calibration

シュワルツの高次価値カテゴリーは、単一の文から人間の価値を検出するタスクにおいて、厳密な階層的ゲートリングやスタンドアロンのコンパクト LLM としてよりも、閾値調整やアンサンブルによる校正、あるいは帰納的バイアスとして活用する方が、限られた計算資源下でより効果的であることが示されました。

Víctor Yeste, Paolo Rosso2026-03-10🤖 cs.LG

LatentMem: Customizing Latent Memory for Multi-Agent Systems

本論文は、LLM 駆動のマルチエージェントシステムにおける記憶の均質化と情報過多という課題を解決するため、エージェント固有の文脈に合わせたコンパクトな潜在記憶を生成する学習可能なフレームワーク「LatentMem」と、その最適化手法「LMPO」を提案し、既存のアーキテクチャを改変せずにも大幅な性能向上を実現したことを示しています。

Muxin Fu, Xiangyuan Xue, Yafu Li, Zefeng He, Siyuan Huang, Xiaoye Qu, Yu Cheng, Yang Yang2026-03-10🤖 cs.LG

Thickening-to-Thinning: Reward Shaping via Human-Inspired Learning Dynamics for LLM Reasoning

本論文は、人間の学習プロセスに着想を得た「厚み化から薄み化（T2T）」という動的報酬枠組みを提案し、誤答時には探索を促す「厚み化」、正解時には冗長性を抑制する「薄み化」を段階的に適用することで、大規模言語モデルの推論能力を大幅に向上させることを示しています。

Wenze Lin, Zhen Yang, Xitai Jiang, Pony Ma, Gao Huang2026-03-10🤖 cs.LG

Inference-Time Backdoors via Hidden Instructions in LLM Chat Templates

この論文は、モデルの重みや訓練データを改変せず、LLM の推論時に実行されるチャットテンプレート（Jinja2 プログラム）を悪用することで、モデルの重みを変更することなく推論時にバックドアを仕込む新たな攻撃手法を提案し、その有効性と既存のセキュリティスキャンによる検出の難しさを示したものである。

Ariel Fogel, Omer Hofman, Eilon Cohen, Roman Vainshtein2026-03-10🤖 cs.LG

Hinge Regression Tree: A Newton Method for Oblique Regression Tree Splitting

本論文は、オブリク回帰木のスプリット学習を非線形最小二乗問題として再定式化し、減衰ニュートン法に基づく高速かつ収束が保証された最適化手法「Hinge Regression Tree (HRT)」を提案し、その普遍近似性と実データにおける高性能な予測精度を実証するものである。

Hongyi Li, Han Lin, Jun Xu2026-03-10🤖 cs.LG

Radial Müntz-Szász Networks: Neural Architectures with Learnable Power Bases for Multidimensional Singularities

この論文は、座標分離型ニューラルネットワークが $1/r$ や $\log r$ などの放射状特異性をモデル化できないことを理論的に示し、学習可能な放射冪 $r^\mu$ と対数項を組み合わせた「Radial Müntz-Szász Networks (RMN)」を提案することで、極めて少ないパラメータ数で高精度かつ物理的に整合性のある解を可能にしたことを報告しています。

Gnankan Landry Regis N'guessan, Bum Jun Kim2026-03-10🤖 cs.LG

SDFed: Bridging Local Global Discrepancy via Subspace Refinement and Divergence Control in Federated Prompt Learning

本論文は、データ分布やリソースの多様性に対応し、ローカルとグローバルな知識の矛盾を解消するため、固定長のグローバルプロンプトと可変長のローカルプロンプトを組み合わせ、部分空間微調整と発散制御を導入した新しいフェデレーティドプロンプト学習フレームワーク「SDFed」を提案し、その有効性を示すものである。

Yicheng Di, Wei Yuan, Tieke He, Yuan Liu, Hongzhi Yin2026-03-10🤖 cs.LG

Retrieval Pivot Attacks in Hybrid RAG: Measuring and Mitigating Amplified Leakage from Vector Seeds to Graph Expansion

この論文は、ベクトル検索と知識グラフを組み合わせたハイブリッド RAG システムにおいて、個別のコンポーネントが安全であっても結合点での権限確認が欠如すると、意図しないデータ漏洩を引き起こす「リトリーバル・ピボット攻撃」の存在を明らかにし、グラフ拡張の境界でアクセス制御を再適用することでこのリスクを低コストで解消できることを示しています。

Scott Thornton2026-03-10🤖 cs.LG

Diffusion-Guided Pretraining for Brain Graph Foundation Models

本論文は、脳グラフのセマンティクスを損なう既存のデータ拡張手法や構造情報の欠如といった課題を解決するため、拡散モデルを用いて構造認識型のドロップ・マスク戦略とトポロジーを考慮した再構成を可能にする統合的な事前学習フレームワーク「Diffusion-Guided Pretraining」を提案し、大規模な神経画像データセットにおける一貫した性能向上を実証したものである。

Xinxu Wei, Rong Zhou, Lifang He, Yu Zhang2026-03-10🤖 cs.LG

Learning Page Order in Shuffled WOO Releases

この論文は、意味的な順序手がかりが乏しいオランダの自由情報開示文書（WOO）のページ順序復元タスクにおいて、セグメント長が長い場合のシーケンス・ツー・シーケンス変換器の一般化失敗やカリキュラム学習の限界を明らかにし、モデルの専門化によって長文書での性能を大幅に向上させることを示しています。

Efe Kahraman, Giulio Tosato2026-03-10🤖 cs.LG

← 前へ次へ →