cs.LG 件の論文 | Gist.Science

Catalogue Grounded Multimodal Attribution for Museum Video under Resource and Regulatory Constraints

本論文は、リソースや規制の制約下で美術館の動画アーカイブの検索性を向上させるため、既存の作品データベースに基づき、ローカルで展開可能な動画言語モデルを用いて作品の要約、カタログ記述の生成、および保守的な類似性マッチングによる作品特定を行う自動化パイプラインを提案するものである。

Minsak Nanang, Adrian Hilton, Armin Mustafa2026-03-13🤖 cs.LG

Systematic Scaling Analysis of Jailbreak Attacks in Large Language Models

この論文は、大規模言語モデルに対するジャイルブレイク攻撃を計算リソースの関数として捉えるスケーリング法則の枠組みを提案し、最適化ベースや遺伝的アルゴリズムなどの多様な攻撃手法を比較評価することで、プロンプトベースの手法が計算効率と隠蔽性の点で優位であり、脆弱性が危害のタイプに強く依存することを明らかにしています。

Xiangwen Wang, Ananth Balashankar, Varun Chandrasekaran2026-03-13🤖 cs.LG

Algorithmic Capture, Computational Complexity, and Inductive Bias of Infinite Transformers

本論文は、無限幅トランスフォーマーが「アルゴリズム的キャプチャ（グロッキング）」を達成する能力を定義し、その推論時の計算量に上限があることを示すことで、効率的な多項式時間ヒューリスティックスキーム（EPTHS）に属する低複雑度アルゴリズムへの誘導バイアスが存在し、より高複雑度アルゴリズムの習得は困難であることを理論的に証明しています。

Orit Davidovich, Zohar Ringel2026-03-13🤖 cs.LG

Learning to Unscramble: Simplifying Symbolic Expressions via Self-Supervised Oracle Trajectories

この論文は、単純な数式をランダムに並べ替えて生成した自己教師ありオラクル軌跡を用いてトランスフォーマーベースの方策ネットワークを訓練し、高エネルギー物理学における複雑な数式の記号的簡化において、従来の強化学習や回帰手法を大幅に上回る高い成功率を達成する新しい手法を提案するものである。

David Shih2026-03-13⚛️ hep-th

Huntington Disease Automatic Speech Recognition with Biomarker Supervision

ハンチントン病の音声認識（ASR）において、高品質な臨床コーパスを用いた体系的な研究により、Parakeet-TDT アーキテクチャの優位性を示し、生体マーカーに基づく補助教師信号を用いることで誤り率を 6.99% から 4.95% まで改善する手法を提案し、コードとモデルをオープンソース化しました。

Charles L. Wang, Cady Chen, Ziwei Gong, Julia Hirschberg2026-03-13🤖 cs.LG

PACED: Distillation at the Frontier of Student Competence

この論文は、学生モデルの習熟度（正解率）が極端な問題に対する学習効率の低下という構造的な課題を理論的に解明し、その中間領域に学習を集中させる重み付け関数を用いた「PACED」という蒸留フレームワークを提案し、標準的なベンチマークで顕著な性能向上と忘却の抑制を実現したことを示しています。

Yuanda Xu, Hejian Sang, Zhengze Zhou, Ran He, Zhipeng Wang2026-03-13🤖 cs.AI

Bayesian Optimization of Partially Known Systems using Hybrid Models

この論文は、既知の物理モデルとガウス過程を組み合わせたハイブリッドモデルを用いたベイズ最適化手法を提案し、部分既知システムの最適化において、標準的なベイズ最適化よりもはるかに少ない試行回数で高品質な解を導出できることを示しています。

Eike Cramer, Luis Kutschat, Oliver Stollenwerk, Joel A. Paulson, Alexander Mitsos2026-03-13🤖 cs.LG

DNS-GT: A Graph-based Transformer Approach to Learn Embeddings of Domain Names from DNS Queries

本論文は、DNS クエリのシーケンスからドメイン名の埋め込みを学習する自己教師あり型トランスフォーマーモデル「DNS-GT」を提案し、ドメイン分類やボットネット検出などのタスクにおいて既存手法を上回る性能を実証したものである。

Massimiliano Altieri, Ronan Hamon, Roberto Corizzo, Michelangelo Ceci, Ignacio Sanchez2026-03-13🤖 cs.LG

Representation Finetuning for Continual Learning

この論文は、パラメータ効率性と安定性を両立させるため、従来の重み空間ではなく表現空間での低ランク部分空間への介入を通じて継続学習を行う新たなフレームワーク「CoRe」を提案し、既存の手法を上回る性能を実証したものである。

Haihua Luo, Xuming Ran, Tommi Kärkkäinen, Huiyan Xue, Zhonghua Chen, Qi Xu, Fengyu Cong2026-03-13🤖 cs.LG

Reference-Guided Machine Unlearning

本論文は、既存の近似学習忘却手法が抱える最適化の不安定さや汎化性能の低下という課題を解決するため、忘却データと真の未見データの分布を一致させることを目指し、保持された独立データセットを参照して蒸馏を行う「ReGUn」という新しい学習忘却フレームワークを提案し、その有効性を示しています。

Jonas Mirlach, Sonia Laguna, Julia E. Vogt2026-03-13🤖 cs.LG

Security-by-Design for LLM-Based Code Generation: Leveraging Internal Representations for Concept-Driven Steering Mechanisms

この論文は、コード生成用大規模言語モデル（LLM）が脆弱性を生成する際にも内部でセキュリティ概念を認識していることを発見し、その内部表現を操作して安全かつ機能的なコード生成を誘導する軽量かつモジュール型の手法「SCS-Code」を提案し、既存の最先端手法を上回る性能を実証したものである。

Maximilian Wendlinger, Daniel Kowatsch, Konstantin Böttinger, Philip Sperl2026-03-13🤖 cs.LG

Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

この論文は、2024 年 8 月から 2026 年 2 月にかけてリリースされた 7 種類の最先端 AI モデルが、企業ネットワークや産業制御システムを対象とした多段階サイバー攻撃シナリオにおいて、推論時の計算リソースの増加とモデル世代の進化に伴い、人間専門家の約 6 時間に相当する 32 段階中の 22 段階を達成するなど、顕著な能力向上を示したことを報告しています。

Linus Folkerts, Will Payne, Simon Inman, Philippos Giavridis, Joe Skinner, Sam Deverett, James Aung, Ekin Zorer, Michael Schmatz, Mahmoud Ghanem, John Wilkinson, Alan Steer, Vy Hong, Jessica Wang2026-03-13🤖 cs.AI

Markovian Generation Chains in Large Language Models

本論文は、大規模言語モデルによる反復推論をマルコフ連鎖として定義し、温度パラメータや初期入力などの要因に応じて文の多様性が増加または減少する動的な収束挙動を明らかにしたものである。

Mingmeng Geng, Amr Mohamed, Guokan Shang, Michalis Vazirgiannis, Thierry Poibeau2026-03-13💬 cs.CL

Trustworthy predictive distributions for rare events via diagnostic transport maps

この論文は、稀な事象を含む高次元データに対する予測分布の信頼性を向上させるため、ベースモデルの誤りを特定・修正する「診断輸送マップ」を提案し、ハリケーン強度の短期予測において実用的な改善効果を実証したものである。

Elizabeth Cucuzzella, Rafael Izbicki, Ann B. Lee2026-03-13📊 stat

Monitoring and Prediction of Mood in Elderly People during Daily Life Activities

この論文は、スマートバンドによる生体信号とモバイルアプリによる生態的瞬間評価（EMA）を組み合わせ、機械学習を用いて高齢者の日常活動中の気分状態を自動的に監視・予測するウェアラブルシステムを提案し、特に「幸福感」と「活動性」の検出において最先端の精度を達成したことを報告しています。

Daniel Bautista-Salinas, Joaquín Roca González, Inmaculada Méndez, Oscar Martinez Mozos2026-03-13🤖 cs.LG

Cough activity detection for automatic tuberculosis screening

南アフリカとウガンダのコミュニティ医療センターで収集された結核患者の咳音データを用いた研究において、XLS-R の最初の 3 層のみを活用した事前学習済みトランスフォーマーモデルが、咳の開始・終了点の自動検出およびその後の結核分類タスクにおいて、既存のモデルやベースラインを凌駕する高い精度と計算効率を実現し、スマートフォンを用いた大規模なスクリーニングツールの実用化可能性を示しました。

Joshua Jansen van Vüren, Devendra Singh Parihar, Daphne Naidoo, Kimsey Zajac, Willy Ssengooba, Grant Theron, Thomas Niesler2026-03-13⚡ eess

A Standardized Framework For Evaluating Gene Expression Generative Models

この論文は、単一細胞遺伝子発現データに対する生成モデルの評価における標準化の欠如と再現性の課題を解決するため、生物学的根拠に基づいた包括的な評価指標とオープンソースフレームワーク「GGE」を提案し、公平な比較と研究の加速を可能にすることを目的としています。

Andrea Rubbi, Andrea Giuseppe Di Francesco, Mohammad Lotfollahi, Pietro Liò2026-03-13🧬 q-bio

Differentiable Thermodynamic Phase-Equilibria for Machine Learning

本研究は、統計熱力学に基づく離散列挙とマスク付きソフトマックス集約、およびストレートスルー勾配推定器を組み合わせた「DISCOMAX」という可微分アルゴリズムを提案し、熱力学的整合性を保証しつつ液体 - 液体平衡データからニューラルネットワークによる過剰ギブズエネルギーモデルを学習可能にする新たな枠組みを示しています。

Karim K. Ben Hicham, Moreno Ascani, Jan G. Rittig, Alexander Mitsos2026-03-13🤖 cs.LG

A Machine Learning-Enhanced Hopf-Cole Formulation for Nonlinear Gas Flow in Porous Media

この論文は、Klinkenberg 効果を含む非線形ガス流を Hopf-Cole 変換と混合定式化、共有トランク型ニューラルネットワーク、および DeepLS ソルバーを統合した機械学習フレームワークにより線形化し、圧力・速度場の高精度予測と圧力依存性透過率などの逆問題の効率的な推定を実現する手法を提案しています。

V. S. Maduru, K. B. Nakshatrala2026-03-13🔢 math

Beyond the Class Subspace: Teacher-Guided Training for Reliable Out-of-Distribution Detection in Single-Domain Models

この論文は、単一ドメインデータで訓練されたモデルが直面する「ドメイン感度の崩壊」という幾何学的な欠陥を理論的に解明し、教師モデルからクラスに抑制された残差構造を蒸留する「教師誘導型学習（TGT）」を提案することで、推論時のオーバーヘッドを増やすことなく分布外検出性能を大幅に向上させる手法を提示しています。

Hong Yang, Devroop Kar, Qi Yu, Travis Desell, Alex Ororbia2026-03-13🤖 cs.LG

← 前へ次へ →