cs.AI 件の論文 | Gist.Science

PnLCalib: Sports Field Registration via Points and Lines Optimization

本論文は、複数のカメラ角度やフィールドの遮蔽といった課題に対処するため、3D サッカー場モデルとキーポイント、および検出されたラインを活用した非線形最適化パイプライン「PnLCalib」を提案し、既存手法を上回るカメラ較正精度とロバスト性を達成したことを示しています。

Marc Gutiérrez-Pérez, Antonio AgudoWed, 11 Ma🤖 cs.AI

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

この論文は、部分的観測性と報酬の希薄性という課題に直面する分散型マルチエージェント強化学習において、異種エージェント間の協調を促進するために、グラフニューラルネットワークを活用した新しい内在的報酬メカニズム「CoHet」を提案し、複数のベンチマークで最先端の手法を上回る性能を実証したものである。

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Sparse Variational Student-t Processes for Heavy-tailed Modeling

本論文は、外れ値や重尾分布に対するロバスト性と大規模データへのスケーラビリティを両立するため、スパース誘導点法を Student-t プロセスに拡張した「スパース変分 Student-t プロセス（SVTP）」を提案し、UCI や Kaggle のデータセットを用いた実験で、スパースガウス過程と比較して外れ値を含むデータにおいて予測誤差を 40% 削減し、収束速度を最大 3 倍向上させることを実証しています。

Jian Xu, Delu Zeng, John PaisleyWed, 11 Ma🤖 cs.AI

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

この論文は、量子化とスパース化の不連続性が勾配伝搬に与える課題を、量子化を付加ノイズとして明示的にモデル化し、リッジ回帰に基づくノイズ除去デ量子化変換を導入することで解決し、任意の精度とスパース性で安定した超効率的なニューラルネットワークの訓練を可能にする統一フレームワークを提案しています。

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

DRUPI: Dataset Reduction Using Privileged Information

本論文は、データセット凝縮において、従来のデータとラベルに加えて特徴量ラベルやアテンションラベルといった「特権情報」を合成して補助的な教師信号として活用する「DCPI」という手法を提案し、既存の手法と組み合わせることで画像認識タスクの性能を大幅に向上させることを示しています。

Shaobo Wang, Youxin Jiang, Tianle Niu, Yantai Yang, Ruiji Zhang, Shuhao Hu, Shuaiyu Zhang, Chenghao Sun, Weiya Li, Conghui He, Xuming Hu, Linfeng ZhangWed, 11 Ma🤖 cs.AI

On the Impact of the Utility in Semivalue-based Data Valuation

この論文は、セミバリューに基づくデータバリュエーションの有用性選択への依存性を解決するため、データポイントを低次元空間に埋め込む「空間的署名」の概念を導入し、有用性の変化に対する結果の堅牢性を定量化する実用的な手法を提案しています。

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

MKE-Coder: Multi-Axial Knowledge with Evidence Verification in ICD Coding for Chinese EMRs

この論文は、中国語の電子カルテにおける ICD 自動コーディングの課題を解決するため、4 つのコーディング軸に基づく多軸知識と臨床エビデンスの検証を組み合わせた新しいフレームワーク「MKE-Coder」を提案し、その有効性を大規模データセットと実証評価で実証したものである。

Xinxin You, Xien Liu, Xue Yang, Ziyi Wang, Ji WuWed, 11 Ma🤖 cs.AI

LLM-Advisor: An LLM Benchmark for Cost-efficient Path Planning across Multiple Terrains

本論文は、大規模言語モデル（LLM）を既存の経路計画アルゴリズムの事後処理アドバイザーとして活用し、幻覚を抑制する戦略を組み合わせることで、多様な地形におけるコスト効率の高い経路計画を可能にする「LLM-Advisor」というフレームワークを提案し、その有効性を検証した研究です。

Ling Xiao, Toshihiko YamasakiWed, 11 Ma🤖 cs.AI

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

この論文では、表形式データ向けに設計されたハイパーネットワークベースの分類モデル「HyConEx」を提案し、予測結果と並行して決定根拠を説明する対照的説明（counterfactual explanations）を生成する、予測と説明を統合した画期的な深層学習モデルを紹介しています。

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek SmiejaWed, 11 Ma🤖 cs.AI

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

本論文は、自然言語と実行可能コードの間の推論ギャップを解決し、自動車ソフトウェアリリース分析において既存手法を上回る精度と高速性を達成する、関係代数を中間表現として活用した新しい LLM エージェント「GateLens」を提案し、その有効性を実証したものである。

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

この論文は、機械学習のバイナリ分類評価における決定論的視点の重要性を説き、適切なスコアリング則（ブライアースコアなど）の活用を提唱するとともに、実務との乖離を埋めるための理論的枠組み、クリップド・ブライアースコアの導出、および実用的な Python パッケージ「briertools」の提供を通じて、臨床的有用性を含む評価手法の改善を提案しています。

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

MCP Bridge: A Lightweight, LLM-Agnostic RESTful Proxy for Model Context Protocol Servers

本論文は、リソース制約のある環境でも利用可能で、Docker 隔離などの多段階セキュリティを実装した軽量な RESTful プロキシ「MCP Bridge」を提案し、さらに強化学習手法を用いて MCPToolBench++ ベンチマークで 70B 級モデルと競合する性能を達成した Qwen3 系列モデルを開発したことを報告しています。

Arash Ahmadi, Sarah Sharif, Yaser M. BanadWed, 11 Ma🤖 cs.AI

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

本論文は、GRPO における「すべてが不正解なグループ」からの学習欠如を解消するため、ステップごとの評価モデルを用いて回答の多様性を確保し、誤った推論からも学習可能にする「Stepwise Guided Policy Optimization（SGPO）」を提案し、その有効性を理論的および実証的に検証したものです。

Peter Chen, Xiaopeng Li, Ziniu Li, Xi Chen, Tianyi LinWed, 11 Ma🤖 cs.AI

Let's Verify Math Questions Step by Step

この論文は、数学的問題の形式、論理的一貫性、完全性を段階的に検証する新しいパイプライン「MathQ-Verify」を提案し、既存のベンチマークで最先端の性能を達成して信頼性の高い数学データセットの構築を可能にすることを示しています。

Chengyu Shen, Zhen Hao Wong, Runming He, Hao Liang, Meiyi Qiang, Zimo Meng, Zhengyang Zhao, Bohan Zeng, Zhengzhou Zhu, Bin Cui, Wentao ZhangWed, 11 Ma🤖 cs.AI

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

本論文は、従来の手法に比べて高速かつ低リソースで、200 万回以上の編集を可能にする「UltraEdit」という新しいモデル編集手法と、それを評価するための大規模ベンチマーク「UltraEditBench」を提案し、大規模言語モデルの安全でスケーラブルな生涯学習の実現に向けた重要な一歩を踏み出したことを示しています。

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

SATURN: SAT-based Reinforcement Learning to Unleash LLMs Reasoning

この論文は、スケーラビリティ、検証可能性、難易度の制御という既存の強化学習タスクの課題を解決するため、充足可能性問題（SAT）に基づき段階的な難易度制御とルールベースの検証を実現する強化学習フレームワーク「SATURN」を提案し、これにより大規模言語モデルの推論能力を大幅に向上させることを示しています。

Huanyu Liu, Ge Li, Jia Li, Hao Zhu, Kechi Zhang, Yihong DongWed, 11 Ma🤖 cs.AI

Daily-Omni: Towards Audio-Visual Reasoning with Temporal Alignment across Modalities

本論文は、クロスモーダルな時間的推論を明示的に必要とするオーディオ・ビジュアル QA ベンチマーク「Daily-Omni」を提案し、多数の基盤モデルを評価することで、現在のマルチモーダル大規模言語モデルがモダリティ間の時間的整合性の確立において依然として課題を抱えていることを明らかにしています。

Ziwei Zhou, Rui Wang, Zuxuan Wu, Yu-Gang JiangWed, 11 Ma🤖 cs.AI

Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment

この論文は、大規模言語モデル（LLM）の事前学習で得られた知識を活用し、メタ学習と signSGD を組み合わせて多様なドメインにまたがる時系列データの品質を効率的かつ高精度に評価する新しいフレームワーク「TSRating」を提案し、その有効性を検証したものです。

Shunyu Wu, Dan Li, Wenjie Feng, Haozheng Ye, Jian Lou, See-Kiong NgWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

本論文は、協力型マルチエージェント強化学習におけるクレジット割り当て問題に対し、協力ゲーム理論の「コア」に基づく利得配分手法 CORA を提案し、エージェント間の連合貢献を適切に評価することで協調的な最適行動を促進し、既存手法を上回る性能を実現することを示しています。

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness

この論文は、現実世界の多変量時系列データが抱えるチャネル間の依存関係、非同期サンプリング、欠損値という 3 つの課題を同時に解決し、堅牢な予測を実現するために、Transformer ベースの「ChannelTokenFormer」という新しいフレームワークを提案し、その有効性を実証したものである。

Jinkwan Jang, Hyungjin Park, Jinmyeong Choi, Taesup KimWed, 11 Ma🤖 cs.AI