DRIFT: Dual-Representation Inter-Fusion Transformer for Automated Driving Perception with 4D Radar Point Clouds

この論文は、4D レーダーの低密度な点群データから高精度な自動運転知覚を実現するため、局所的な詳細特徴と大域的な文脈情報を双経路アーキテクチャで融合する「DRIFT」というモデルを提案し、物体検出や自由道路推定において既存手法を上回る性能を示したことを述べています。

Siqi Pei, Andras Palffy, Dariu M. Gavrila2026-03-11💻 cs

TemporalDoRA: Temporal PEFT for Robust Surgical Video Question Answering

本論文は、手術動画の質問応答タスクにおいて言語的バイアスへの頑健性と時間的根拠の把握を両立させるため、低ランク適応(LoRA)の学習可能ブランチに軽量な時間的注意機構を組み込んだ新しいパラメータ効率的微調整手法「TemporalDoRA」を提案し、新たに作成したREAL-Colon-VQAデータセットなどを用いた実験でその有効性を実証しています。

Luca Carlini, Chiara Lena, Cesare Hassan, Danail Stoyanov, Elena De Momi, Sophia Bano, Mobarak I. Hoque2026-03-11💻 cs

An Empirical Study of Interaction Smells in Multi-Turn Human-LLM Collaborative Code Generation

本論文は、マルチターン人間-LLM 協調コード生成における「インタラクションスメル」という新たな問題領域を定義し、実世界データに基づく分類体系の確立、主要モデル間の分布分析、そしてグローバル不変性の抽出と事前品質監査を行うマルチエージェントフレームワーク「InCE」による効果的な軽減手法の提案を通じて、この課題を体系的に解明した研究である。

Binquan Zhang, Li Zhang, Lin Shi, Song Wang, Yuwei Qian, Linhui Zhao, Fang Liu, An Fu, Yida Ye2026-03-11💻 cs

TriFusion-SR: Joint Tri-Modal Medical Image Fusion and SR

本論文は、離散ウェーブレット変換を用いた周波数帯域分解と条件付き拡散モデルを組み合わせた「TriFusion-SR」という新しいフレームワークを提案し、MRI、CT、PET といった 3 種類の医療画像の融合と超解像を同時に処理することで、既存手法の限界を克服し、画質と診断精度を大幅に向上させることを示しています。

Fayaz Ali Dharejo, Sharif S. M. A., Aiman Khalil, Nachiket Chaudhary, Rizwan Ali Naqvi, Radu Timofte2026-03-11💻 cs

ProGS: Towards Progressive Coding for 3D Gaussian Splatting

本論文は、3D ガウススプラッティングのデータ圧縮とストリーミング配信の課題を解決するため、オクトリー構造と相互情報量強化メカニズムを導入し、保存容量を 45 倍削減しながら視覚品質を 10% 以上向上させるプログレッシブ符号化方式「ProGS」を提案するものである。

Zhiye Tang, Lingzhuo Liu, Shengjie Jiao, Qiudan Zhang, Junhui Hou, You Yang, Xu Wang2026-03-11💻 cs

Robotic Scene Cloning:Advancing Zero-Shot Robotic Scene Adaptation in Manipulation via Visual Prompt Editing

本論文は、既存のロボット操作軌跡を視覚的プロンプトで編集する「Robotic Scene Cloning(RSC)」を提案し、ゼロショット学習による実世界でのロボットタスク適応と汎化性能の向上を実現する手法を提示しています。

Binyuan Huang, Yuqing Wen, Yucheng Zhao, Yaosi Hu, Tiancai Wang, Chang Wen Chen, Haoqiang Fan, Zhenzhong Chen2026-03-11💻 cs

GSStream: 3D Gaussian Splatting based Volumetric Scene Streaming System

本論文は、3D ガウススプラッティングの大容量データ問題に対処するため、複数ユーザーの行動を学習する協調的ビューポート予測と深層強化学習に基づくビットレート適応を組み合わせた、高画質かつ効率的な volumetric シーンストリーミングシステム「GSStream」を提案し、その有効性を検証したものである。

Zhiye Tang, Qiudan Zhang, Lei Zhang, Junhui Hou, You Yang, Xu Wang2026-03-11💻 cs

FrameDiT: Diffusion Transformer with Frame-Level Matrix Attention for Efficient Video Generation

本論文は、拡散モデルにおける高忠実度動画生成の課題を解決するため、フレーム全体を行列として処理する「Matrix Attention」を導入し、大規模な動きの捕捉と効率的な計算を両立する新しいアーキテクチャ「FrameDiT」を提案し、複数のベンチマークで最先端の性能を達成したことを報告しています。

Minh Khoa Le, Kien Do, Duc Thanh Nguyen, Truyen Tran2026-03-11💻 cs

Idempotent Slices with Applications to Code-Size Reduction

この論文は、一般的な制御フローグラフに適用可能な健全かつ効率的な「冪等バックスライス」の定式化と抽出アルゴリズムを提案し、これを用いて非連続な命令シーケンスをマージする疎なコードサイズ削減最適化を実現し、LLVM テストスイートにおいて最大 7.24% のコードサイズ削減を達成したことを報告しています。

Rafael Alvarenga de Azevedo, Daniel Augusto Costa de Sa, Rodrigo Caetano Rocha, Fernando Magno Quintão Pereira2026-03-11💻 cs

WVA: A Global Optimization Control Plane for llmd

LLM の推論インフラにおけるリソース効率と SLO 維持を両立するため、推論サーバーの内部状態と密接に連携し、プロアクティブなスケール制御と断片化を考慮したスケールダウンを行う「WVA」という制御平面を提案し、従来の HPA と比較して実効スループットを 37% 向上させ、リクエスト失敗を 10 倍削減する効果を実証した。

Abhishek Malvankar, Lionel Villard, Mohammed Abdi, Evgeny Shindin, Braulio Dumba, Vishakha Ramani, Asser Tantawi, Tamar Eilam2026-03-11💻 cs

FetalAgents: A Multi-Agent System for Fetal Ultrasound Image and Video Analysis

本論文は、診断・計測・セグメンテーションの各タスクを専門とする複数のエージェントを動的に調整し、静止画解析から動画ストリームの構造化臨床レポート生成までを一貫して支援する、初めての包括的な胎児超音波画像・動画解析マルチエージェントシステム「FetalAgents」を提案し、その多施設外部評価における卓越した性能を実証しています。

Xiaotian Hu, Junwei Huang, Mingxuan Liu, Kasidit Anmahapong, Yifei Chen, Yitong Luo, Yiming Huang, Xuguang Bai, Zihan Li, Yi Liao, Haibo Qu, Qiyuan Tian2026-03-11💻 cs

Ensuring Data Freshness in Multi-Rate Task Chains Scheduling

この論文は、安全クリティカルな自律システムにおいて、データの鮮度制約に基づいてタスクのオフセットを最適化し、Just-in-Time 方式でデータ生成を調整することで、LET パラダイムの遅延や過剰サンプリングを排除しつつ、エンドツーエンドのデータ鮮度を保証し、かつグローバル EDF の 100% のスケジューラビリティを維持する新しいタスクベースのスケジューリング枠組みを提案しています。

José Luis Conradi Hoffmann, Antônio Augusto Fröhlich2026-03-11💻 cs

Let's Reward Step-by-Step: Step-Aware Contrastive Alignment for Vision-Language Navigation in Continuous Environments

本論文は、連続環境における視覚言語ナビゲーション(VLN-CE)において、SFT の累積誤差や RFT のスパースな報酬という課題を解決するため、不完全な軌道から密な教師信号を抽出し、ステップごとの進捗評価と動的なバッチ処理を行う「ステップ認識型対照的アライメント(SACA)」を提案し、SOTA 性能を達成したことを示しています。

Haoyuan Li, Rui Liu, Hehe Fan, Yi Yang2026-03-11💻 cs

ENIGMA-360: An Ego-Exo Dataset for Human Behavior Understanding in Industrial Scenarios

本論文は、産業現場における人間の行動理解を促進するため、現実の環境で同期された 180 組の egocentric(主観的)および exocentric(客観的)360 度動画を収集し、時間的・空間的注釈を付与した新しいデータセット「ENIGMA-360」とそのベンチマーク結果を公開するものである。

Francesco Ragusa, Rosario Leonardi, Michele Mazzamuto, Daniele Di Mauro, Camillo Quattrocchi, Alessandro Passanisi, Irene D'Ambra, Antonino Furnari, Giovanni Maria Farinella2026-03-11💻 cs

Simultaneous Embedding of Two Paths on the Grid

この論文は、2 つのパスの同時幾何学的埋め込みにおける最長辺の長さの最小化が NP 困難であることを示し、一方のパスが x 単調でもう一方が y 単調である場合、その埋め込みを含む整数グリッドの周長を O(n3/2)O(n^{3/2}) 時間で最小化できることを証明しています。

Stephen Kobourov, William Lenhart, Giuseppe Liotta, Daniel Perz, Pavel Valtr, Johannes Zink2026-03-11💻 cs

The Richest Paradigm You're Not Using: Commercial Videogames at the Intersection of Human-Computer Interaction and Cognitive Science

この論文は、認知科学の理論的枠組みを用いることで、人間とコンピュータの相互作用(HCI)およびゲームデザインの観点から商業用ビデオゲームを研究環境として再評価し、実験室環境の限界を補完する新たなアプローチを提案するものである。

Jaap Munneke, Jennifer E. Corbett2026-03-11💻 cs