Geodesic Gradient Descent: A Generic and Learning-rate-free Optimizer on Objective Function-induced Manifolds

本論文は、目的関数によって誘起される多様体の幾何構造を n 次元球で局所的に近似し、学習率を不要とする測地線勾配降下法(GGD)を提案し、全結合ネットワークおよび畳み込みニューラルネットワークにおいて Adam などの既存手法を上回る性能向上を実証しています。

Liwei Hu, Guangyao Li, Wenyong Wang, Xiaoming Zhang, Yu Xiang2026-03-10🤖 cs.LG

How the Graph Construction Technique Shapes Performance in IoT Botnet Detection

この論文は、VAE による次元削減と GAT を用いた IoT ボットネット検出において、グラフ構築手法(kNN、MNN、SNN、ガブリエルグラフ、ε-半径グラフ)の選択が分類性能に大きな影響を与えることを示し、ガブリエルグラフを用いた場合に 97.56% の最高精度を達成したことを報告しています。

Hassan Wasswa, Hussein Abbass, Timothy Lynar2026-03-10🤖 cs.LG

Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach

本論文は、現代の AI アプリケーションが求める高効率な検索、高速インデックス作成、低メモリ使用量などの 6 つの要件をすべて満たすため、投影技術とグラフインデックスを統合した新しい近似最近傍検索フレームワーク「PAG」を提案し、HNSW より最大 5 倍高速な検索性能を実現することを示しています。

Kejing Lu, Zhenpeng Pan, Jianbin Qin, Yoshiharu Ishikawa, Chuan Xiao2026-03-10🤖 cs.LG

EnsAug: Augmentation-Driven Ensembles for Human Motion Sequence Analysis

この論文は、人間の骨格運動の幾何学的・運動学的制約を無視した従来のデータ拡張手法の限界を克服し、それぞれ異なる単一の幾何学的変換で拡張されたデータを用いて専門家のモデルを個別に学習させる「EnsAug」というアノテーション駆動のアンサンブル手法を提案し、手話認識や人間活動認識のタスクにおいて最先端の精度を達成したことを示しています。

Bikram De, Habib Irani, Vangelis Metsis2026-03-10🤖 cs.LG

HyperTokens: Controlling Token Dynamics for Continual Video-Language Understanding

本論文は、マルチモーダル LLM による継続的ビデオ QA におけるタスク間干渉と記憶コストの課題を解決するため、メタ学習に基づく正則化や因果的視点からの補助的マルチモーダル監督を活用し、メモリ固定条件下でトークンを動的に生成・制御する「HyperTokens」を提案し、高い精度と低い忘却を実現する手法を報告しています。

Toan Nguyen, Yang Liu, Celso De Melo, Flora D. Salim2026-03-10🤖 cs.LG

Unmixing microinfrared spectroscopic images of cross-sections of historical oil paintings

この論文は、歴史的な油彩画の断面を分析する際、大気や取得アーティファクトの影響を軽減し、解釈性を向上させるために、重み付きスペクトル角度距離(WSAD)損失関数とパッチベースのモデル化を組み合わせた教師なし CNN オートエンコーダーを提案し、ヴァン・エイク兄弟に帰属する「ゲントの祭壇画」の断面データでその有効性を実証したものである。

Shivam Pande, Nicolas Nadisic, Francisco Mederos-Henry, Aleksandra Pizurica2026-03-10🤖 cs.LG

Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

本論文は、チャートの深層分析能力の向上に向けた課題として、多様な報酬信号やデータ間の競合を解消する並列相対方策最適化(PRPO)と、エラー注入に基づく客観的評価ベンチマーク(MCDR-Bench)を提案し、これらを通じてチャート深層分析のトレーニングと評価を体系的に改善する統合フレームワークを構築したことを示しています。

Jiajin Tang, Gaoyang, Wenjie Wang, Sibei Yang, Xing Chen2026-03-10🤖 cs.LG

One step further with Monte-Carlo sampler to guide diffusion better

この論文は、事後サンプリングにおける推定誤差を軽減し、より高品質な生成を実現するために、追加の逆方向ノイズ除去ステップとモンテカルロサンプリングを組み合わせたプラグアンドプレイ手法「ABMS」を提案し、理論的解析と多様なタスクにおける実験を通じてその有効性を証明したものである。

Minsi Ren, Wenhao Deng, Ruiqi Feng, Tailin Wu2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

この論文は、訓練データが存在しない条件下でも、畳み込みフィルタリングと最適化された早期停止戦略を用いた教師なし学習フレームワークにより、高エネルギー加速器のビーム診断において低信号対雑音比環境でのビームエミッタンス画像の高精度な復元とビームハローの解像度向上を実現する手法を提案しています。

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

Soft Equivariance Regularization for Invariant Self-Supervised Learning

この論文は、不変性と等変性のトレードオフを解決するため、最終埋め込みには不変性を維持しつつ中間空間トークンマップに等変性を「ソフト」に付与する新しい正則化手法「Soft Equivariance Regularization (SER)」を提案し、画像認識や物体検出などのタスクで既存の自己教師あり学習手法を大幅に改善することを示しています。

Joohyung Lee, Changhun Kim, Hyunsu Kim, Kwanhyung Lee, Juho Lee2026-03-10🤖 cs.LG

On the Generalization Capacities of MLLMs for Spatial Intelligence

本論文は、RGB 入力のみを用いたマルチモーダル大規模言語モデル(MLLM)がカメラ固有のパラメータに過剰適合し汎化能力に欠けることを指摘し、カメラ内部パラメータの注入、カメラパラメータの多様化によるデータ拡張、および 3D 視覚基盤モデルからの幾何学的知識の蒸留を行う「カメラ認識型 MLLM」を提案することで、空間推論タスクにおけるカメラ間での汎化性能を大幅に向上させることを示しています。

Gongjie Zhang, Wenhao Li, Quanhao Qian, Jiuniu Wang, Deli Zhao, Shijian Lu, Ran Xu2026-03-10🤖 cs.LG

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

本論文は、大規模なツール環境において小規模言語モデル(SLM)がコンテキストの制御と実行構造を学習し、ルブリックに基づく強化学微細調整を通じて、パラメータやコンテキスト制約が厳しい条件下でも最先端のエージェントに匹敵する性能を発揮できるようにする「ATLAS」というフレームワークを提案するものである。

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

From Statistical Fidelity to Clinical Consistency: Scalable Generation and Auditing of Synthetic Patient Trajectories

プライバシー規制により制限される電子カルテの共有を可能にするため、MIMIC-IV データベースを用いて高忠実度の生成モデルと大規模言語モデルによる自動監査を組み合わせたパイプラインを開発し、統計的忠実度だけでなく臨床的一貫性も保証された合成患者トラジェクトリを生成し、その結果、下流タスクでの性能向上とプライバシーリスクの不在を実証しました。

Guanglin Zhou, Armin Catic, Motahare Shabestari, Matthew Young, Chaiquan Li, Katrina Poppe, Sebastiano Barbieri2026-03-10🤖 cs.LG

ProtAlign: Contrastive learning paradigm for Sequence and structure alignment

本論文は、タンパク質の配列と構造の情報を対照学習を用いて統合し、両者の埋め込み空間を一致させることで、クロスモーダル検索や機能予測などの下流タスクの性能向上とタンパク質の理解・設計への新たな洞察を提供する「ProtAlign」というフレームワークを提案しています。

Aditya Ranganath, Hasin Us Sami, Kowshik Thopalli, Bhavya Kailkhura, Wesam Sakla2026-03-10🤖 cs.LG

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

本論文は、時系列基盤モデルが捉えた過去のパターンを予測特徴量として回帰モデルに注入する「FutureBoosting」という新しいハイブリッド AI 手法を提案し、電力価格予測の精度を大幅に向上させることを実証しています。

Yunzhong Qiu, Binzhu Li, Hao Wei, Shenglin Weng, Chen Wang, Zhongyi Pei, Mingsheng Long, Jianmin Wang2026-03-10🤖 cs.LG