DOPD: A Dynamic PD-Disaggregation Architecture for Maximizing Goodput in LLM Inference Serving

本論文は、LLM 推論におけるプリフィルとデコードステージ間の負荷不均衡を解消し、SLO 遵守を維持しつつシステムスループットを最大化するために、リアルタイム負荷監視に基づいて動的にインスタンス割当を最適化する「DOPD」というアーキテクチャを提案し、既存手法と比較して大幅な性能向上を実証したものである。

Junhan Liao, Minxian Xu, Wanyi Zheng, Yan Wang, Kejiang Ye, Rajkumar Buyya, Chengzhong Xu2026-03-10💻 cs

Integrating a Causal Foundation Model into a Prescriptive Maintenance Framework for Optimising Production-Line OEE

この論文は、統計的相関に依存する従来の予測モデルの限界を克服し、事前学習された因果基礎モデルを「What-if」シミュレーターとして統合することで、故障の根本原因を特定し介入効果を定量化して生産ラインの OEE を最適化する処方箋保全フレームワークを提案しています。

Felix Saretzky, Lucas Andersen, Thomas Engel, Fazel Ansari2026-03-10💻 cs

Confidential, Attestable, and Efficient Inter-CVM Communication with Arm CCA

この論文は、Arm 機密計算アーキテクチャ(CCA)のファームウェアを拡張して、ハイパーバイザーや他の CVM からはアクセス不能な「機密共有メモリ(CSM)」を実現するシステム「CAEC」を提案し、暗号化を介さずに CVM 間で安全かつ高効率なデータ共有を可能にするものである。

Sina Abdollahi, Amir Al Sadi, Marios Kogias, David Kotz, Hamed Haddadi2026-03-10💻 cs

HiconAgent: History Context-aware Policy Optimization for GUI Agents

本論文は、GUI エージェントが過去の履歴情報を効率的かつ効果的に活用できるよう、動的なコンテキストサンプリングとアンカーガイド付き履歴圧縮を備えた「History Context-aware Policy Optimization (HCPO)」を導入し、HiconAgent を開発することで、小型モデルでありながら既存の大型モデルを上回る性能と計算効率の向上を実現したことを報告しています。

Xurui Zhou, Gongwei Chen, Yuquan Xie, Zaijing Li, Kaiwen Zhou, Shuai Wang, Shuo Yang, Zhuotao Tian, Rui Shao2026-03-10💻 cs

When Token Pruning is Worse than Random: Understanding Visual Token Information in VLLMs

本論文は、VLLM の深い層における視覚トークンの情報量が「情報地平線」を超えて均質化・消失し、それ以降の層では既存の剪定法よりもランダム剪定の方が効率的であることを発見し、これを活用した手法が高性能・高効率を実現することを示しています。

Yahong Wang, Juncheng Wu, Zhangkai Ni, Longzhen Yang, Yihang Liu, Chengmei Yang, Ying Wen, Lianghua He, Xianfeng Tang, Hui Liu, Yuyin Zhou2026-03-10💻 cs

IPPO Learns the Game, Not the Team: A Study on Generalization in Heterogeneous Agent Teams

本論文は、異種エージェント環境における自己対戦ベースの IPPO が、多様なトレーニングパートナーを意図的に導入する手法(RPT)と同等の汎化性能を示すことを明らかにし、単純な IPPO ベースラインが新規チームメイトに対しても十分な適応能力を有していることを実証しています。

Ryan LeRoy, Jack Kolb2026-03-10💻 cs

Beyond Endpoints: Path-Centric Reasoning for Vectorized Off-Road Network Extraction

オフロード環境における道路ネットワーク抽出の課題を解決するため、大規模なオフロードデータセット「WildRoad」を公開し、従来のノード中心アプローチの限界を克服する経路中心のフレームワーク「MaGRoad」を提案し、高い精度と高速推論を実現する研究です。

Wenfei Guan, Jilin Mei, Tong Shen, Xumin Wu, Shuo Wang, Chen Min, Yu Hu2026-03-10💻 cs

ReMeDI: Refined Memory for Disambiguation of Identities with SAM3 in Surgical Segmentation

本論文は、手術映像における器具セグメンテーションの課題を解決するため、SAM3 のメモリ更新や容量制限、再出現時の識別問題を克服するトレーニング不要な拡張手法「ReMeDI-SAM3」を提案し、複数のデータセットで既存手法を上回る性能を達成したことを報告しています。

Valay Bundele, Mehran Hosseinzadeh, Hendrik P. A. Lensch2026-03-10💻 cs

It is not always greener on the other side: Greenery perception across demographics and personalities in multiple cities

この論文は、5 か国 1,000 人の調査とストリートビュー画像を用いた分析を通じて、都市の緑化に対する主観的認識と客観的測定値の乖離が世界的に普遍的であり、個人の属性や性格よりも居住地域による文化的・環境的経験の影響が最も大きいことを明らかにしています。

Matias Quintana, Fangqi Liu, Jussi Torkko, Youlong Gu, Xiucheng Liang, Yujun Hou, Koichi Ito, Yihan Zhu, Mahmoud Abdelrahman, Tuuli Toivonen, Yi Lu, Filip Biljecki2026-03-10💻 cs

Cost Trade-offs of Reasoning and Non-Reasoning Large Language Models in Text-to-SQL

この論文は、Google BigQuery 上の大規模データセットを用いた実験を通じて、推論モデルが非推論モデルと比較してデータ転送量を大幅に削減しつつ同等の精度を維持し、実行時間とクラウドコストの相関が弱いことを示し、Text-to-SQL 導入におけるコスト最適化の指針を提示しています。

Saurabh Deochake, Debajyoti Mukhopadhyay2026-03-10💻 cs

NashOpt -- A Python Library for Computing Generalized Nash Equilibria

NashOpt は、共有制約を持つ非協力ゲームにおける一般ナッシュ均衡の計算と設計を可能にするオープンソースの Python ライブラリであり、JAX を活用した非線形最小二乗法や混合整数線形計画法を通じて、非線形ゲームから線形二次ゲーム、逆ゲームやスタッケルベルグゲーム設計問題までを包括的にサポートします。

Alberto Bemporad2026-03-10💻 cs

DrivingGen: A Comprehensive Benchmark for Generative Video World Models in Autonomous Driving

本論文は、自動運転における生成ワールドモデルの進捗を測定し、視覚的リアリズム、軌道の妥当性、時間的整合性、制御性を包括的に評価する初のベンチマーク「DrivingGen」を提案し、既存モデルの課題とトレードオフを明らかにしたものである。

Yang Zhou, Hao Shao, Letian Wang, Zhuofan Zong, Hongsheng Li, Steven L. Waslander2026-03-10💻 cs