RSH-SpMM: A Row-Structured Hybrid Kernel for Sparse Matrix-Matrix Multiplication on GPUs

本論文は、実世界の疎行列における極端な不規則性に対応し、Tensor Core の利用率とスループットを最大化するため、適応的な行分割と RS-Tile 表現を採用したハイブリッドカーネル「RSH-SpMM」を提案し、最先端の手法と比較して最大 6.13 倍の高速化を実現したことを報告しています。

Aiying Li, Jingwei Sun, Han Li, Wence Ji, Guangzhong Sun2026-03-11💻 cs

FormalRTL: Verified RTL Synthesis at Scale

この論文は、曖昧な仕様や形式保証の欠如といった産業規模のハードウェア設計における課題を克服するため、ソフトウェア参照モデルを形式仕様として統合し、計画・合成・形式等価性検査を密接に連携させる新しいマルチエージェントフレームワーク「FormalRTL」を提案し、大規模な産業グレードのベンチマークによる評価でその有効性を示したものです。

Kezhi Li, Min Li, Xiangyu Wen, Shibo Zhao, Jieying Wu, Junhua Huang, Qiang Xu2026-03-11💻 cs

Adaptive Multi-Objective Tiered Storage Configuration for KV Cache in LLM Service

この論文は、LLM 推論における KV キャッシュのオフロードを多目的最適化問題として定式化し、非解析的な目的関数と複雑な変数結合を効率的に処理する「Kareto」という適応型最適化ツールを提案することで、コスト、スループット、レイテンシのバランスを最適化し、固定構成に比べて最大 9.3% のスループット向上や最大 58.3% のレイテンシ削減を実現することを示しています。

Xianzhe Zheng, Zhengheng Wang, Ruiyan Ma, Rui Wang, Xiyu Wang, Rui Chen, Peng Zhang, Sicheng Pan, Zhangheng Huang, Chenxin Wu, Yi Zhang, Bo Cai, Kan Liu, Teng Ma, Yin Du, Dong Deng, Sai Wu, Guoyun Zhu, Wei Zhang, Feifei Li2026-03-11💻 cs

Extension of ACETONE C code generator for multi-core architectures

この論文は、安全クリティカルシステム向けに開発された機械学習用 C 言語コード生成フレームワーク「ACETONE」を、マルチコアアーキテクチャに対応させるため、プロセッサ割り当て問題の定義や既存手法の調査を通じて並列コード生成機能の拡張を提案するものである。

Yanis Aït-Aïssa (IRIT-TRACES), Thomas Carle (IRIT-TRACES), Sergei Chichin, Benjamin Lesage, Claire Pagetti2026-03-11💻 cs

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

本論文は、計算内蔵メモリ(CIM)アクセラレータの設計空間探索を自動化し、大規模言語モデル(LLM)エージェントと設計空間剪定技術を用いてシミュレーションから最適化までのワークフローを効率化し、DNN ワークロードに対する最適構成の迅速な特定を可能にする「ChatNeuroSim」というフレームワークを提案するものである。

Ming-Yen Lee, Shimeng Yu2026-03-11💻 cs

Electoral Systems Simulator: An Open Framework for Comparing Electoral Mechanisms Across Voter Distribution Scenarios

本論文は、有権者の分布シナリオに基づいて複数の選挙制度をシミュレーションし、その結果と有権者分布の幾何学的中央値との距離を評価するオープンソースの Python フレームワーク「electoral_sim」を提案し、既存の制度から理論的な上限性能を示す仮想的な新方式までを比較検証したものである。

Sumit Mukherjee2026-03-11💻 cs

Serving Compound Inference Systems on Datacenter GPUs

複数の ML モデルをタスクグラフとして構成する化合物推論システムに対し、モデルのバリエーション選択と GPU の空間的パーティショニングを統合的に最適化することで、既存の手法と比較して最大 11.3 倍のサービス処理能力を実現し、高い精度と低遅延を維持しながら GPU リソースを大幅に削減する「JigsawServe」という新しい推論サービスフレームワークを提案する論文です。

Sriram Devata, Rahul Singh, Sarita Adve2026-03-11💻 cs

Granulon: Awakening Pixel-Level Visual Encoders with Adaptive Multi-Granularity Semantics for MLLM

この論文は、CLIP ベースの視覚エンコーダが抱える細粒度理解の課題と DINOv3 が持つ粗粒度抽象化の欠点を補うため、テキスト入力に応じて視覚抽象化レベルを動的に調整する「Granulon」という新しいマルチモーダル大規模言語モデルを提案し、単一のフォワードパスでピクセルから粗粒度までを統合的に推論可能にすることで、精度の向上とハルシネーションの削減を実現したことを示しています。

Junyuan Mao, Qiankun Li, Linghao Meng, Zhicheng He, Xinliang Zhou, Kun Wang, Yang Liu, Yueming Jin2026-03-11💻 cs

Where, What, Why: Toward Explainable 3D-GS Watermarking

この論文は、3D ガウススプラッティングの品質を損なわずにロバストな透かし埋め込みを実現し、どのガウスプリミティブに情報を埋め込み、なぜそれが選択されたかを説明可能な「Trio-Experts」モジュールと「SBAG」ゲートを用いた新しいフレームワークを提案するものです。

Mingshu Cai, Jiajun Li, Osamu Yoshie, Yuya Ieiri, Yixuan Li2026-03-11💻 cs

VisionCreator-R1: A Reflection-Enhanced Native Visual-Generation Agentic Model

本論文は、視覚生成エージェントにおける中間エラー修正のための体系的なリフレクション機構の欠如を解決するため、リフレクションと計画の非対称性を踏まえた「リフレクション・プラン共最適化(RPCO)」トレーニング手法を提案し、これにより単一画像および複数画像タスクにおいて既存のベンチマークで Gemini2.5 Pro を凌駕する VisionCreator-R1 を開発したことを報告しています。

Jinxiang Lai, Wenzhe Zhao, Zexin Lu, Hualei Zhang, Qinyu Yang, Rongwei Quan, Zhimin Li, Shuai Shao, Song Guo, Qinglin Lu2026-03-11💻 cs

HMR-1: Hierarchical Massage Robot with Vision-Language-Model for Embodied Healthcare

本論文は、視覚言語モデルを用いた階層的なマッサージロボット「HMR-1」を提案し、12,190 枚の画像と 17 万 4,177 組の QA ペアからなるマルチモーダルデータセット「MedMassage-12K」および評価ベンチマークを構築することで、医療分野における身体知能の課題を解決し、実機実験を通じてその実用性を検証したものです。

Rongtao Xu, Mingming Yu, Xiaofeng Han, Yu Zhang, Kaiyi Hu, Zhe Feng, Zenghuang Fu, Changwei Wang, Weiliang Meng, Xiaopeng Zhang2026-03-11💻 cs

Impact of Different Failures on a Robot's Perceived Reliability

この研究は、オンライン動画実験を通じて、ロボットが失敗した際の種類(ミス、スリップ、凍結)が人間の信頼度に与える影響が異なり、ミスはスリップや凍結よりも信頼回復に寄与しやすく、その後の成功が信頼を回復させることを明らかにしました。

Andrew Violette, Zhanxin Wu, Haruki Nishimura, Masha Itkina, Leticia Priebe Rocha, Mark Zolotas, Guy Hoffman, Hadas Kress-Gazit2026-03-11💻 cs

d-QBF with Few Existential Variables Revisited

この論文は、存在量化変数の数 kk をパラメータとする d-QBF 問題において、一般には ETH 仮説の下で $2^{2^{o(k)}}の時間が必要であり二重指数依存性が最適であることを証明するとともに、2つの量化ブロック( の時間が必要であり二重指数依存性が最適であることを証明するとともに、2 つの量化ブロック(\forall\exists$-QBF)に限定された場合にはより効率的なアルゴリズムとほぼ最適な下界を示すことで、既存研究のギャップを埋める結果を報告しています。

Andreas Grigorjew, Michael Lampis2026-03-11💻 cs

HeteroFedSyn: Differentially Private Tabular Data Synthesis for Heterogeneous Federated Settings

本論文は、異質なデータ分布を持つ水平フェデレーテッド学習環境において、従来の手法が抱えるバイアスや過剰なノイズの問題を解決し、中央集権的な合成と同等の有用性を達成する新たな差分プライバシー対応表形式データ合成フレームワーク「HeteroFedSyn」を提案するものです。

Xiaochen Li, Fengyu Gao, Xizixiang Wei, Tianhao Wang, Cong Shen, Jing Yang2026-03-11💻 cs

NaviNote: Enabling In-situ Spatial Annotation Authoring to Support Exploration and Navigation for Blind and Low Vision People

本論文は、視覚障害者向けに高精度な視覚位置推定技術とエージェント型アーキテクチャを組み合わせ、音声による場所の注釈作成と精密なナビゲーションを可能にする「NaviNote」を開発し、その有効性をユーザー評価で実証したものである。

Ruijia Chen, Yuheng Wu, Charlie Houseago, Filipe Gaspar, Filippo Aleotti, Dorian Gálvez-López, Oliver Johnston, Diego Mazala, Guillermo Garcia-Hernando, Maryam Bandukda, Gabriel Brostow, Jessica Van Brummelen2026-03-11💻 cs