YOLO-NAS-Bench: A Surrogate Benchmark with Self-Evolving Predictors for YOLO Architecture Search

この論文は、YOLO 系オブジェクト検出器のニューラルアーキテクチャ探索における高コストな評価問題を解決するため、COCO-mini 上で学習した 1,500 個のアーキテクチャと、高性能領域に特化して自己進化するメカニズムにより精度を向上させた LightGBM 代理モデルを組み合わせた、初の YOLO 向け代理ベンチマーク「YOLO-NAS-Bench」を提案し、公式 YOLO バイアスを超えた高性能アーキテクチャの発見を実証しています。

Zhe Li, Xiaoyu Ding, Jiaxin Zheng, Yongtao Wang2026-03-11💻 cs

RiO-DETR: DETR for Real-time Oriented Object Detection

この論文は、向き付き物体検出の課題を解決し、リアルタイム性と高精度を両立する初の検出トランスフォーマー「RiO-DETR」を提案し、主要なデータセットで新たな速度と精度のトレードオフを確立したことを報告しています。

Zhangchi Hu, Yifan Zhao, Yansong Peng, Wenzhang Sun, Xiangchen Yin, Jie Chen, Peixi Wu, Hebei Li, Xinghao Wang, Dongsheng Jiang, Xiaoyan Sun2026-03-11💻 cs

CIGPose: Causal Intervention Graph Neural Network for Whole-Body Pose Estimation

CIGPose は、視覚的コンテキストに起因する偽の相関を構造的因果モデルに基づいて特定し、予測不確実性を用いた因果介入モジュールと階層的グラフニューラルネットワークを組み合わせることで、解剖学的に妥当な全身ポーズ推定を実現し、COCO-WholeBody ベンチマークで新たな最先端性能を達成するフレームワークです。

Bohao Li, Zhicheng Cao, Huixian Li, Yangming Guo2026-03-11💻 cs

MetaDAT: Generalizable Trajectory Prediction via Meta Pre-training and Data-Adaptive Test-Time Updating

この論文は、メタ学習による事前学習と、テスト時のデータ特性に応じた学習率や更新頻度を動的に調整するデータ適応型メカニズムを導入することで、分布シフト下における軌道予測の性能を大幅に向上させる手法「MetaDAT」を提案しています。

Yuning Wang, Pu Zhang, Yuan He, Ke Wang, Jianru Xue2026-03-11💻 cs

An Analysis of Modern Web Security Vulnerabilities Inside WebAssembly Applications

この論文は、WebAssembly モジュールにおけるバッファオーバーフローなどのバイナリ脆弱性が、SQL インジェクションや XS-Leaks といった Web 固有のセキュリティ侵害を引き起こし、既存の防御策を無効化する可能性を示し、そのリスクを軽減するためのベストプラクティスを提案しています。

Lorenzo Corrias, Lorenzo Pisu, Davide Maiorca, Giorgio Giacinto2026-03-11💻 cs

First Steps towards Categorical Algebraic Artificial Chemistry

この論文は、人工生命の分野における Fontana と Buss の計算モデル「AlChemy」を一般化し、圏論を用いて代数的人工化学の相互作用コンポーネントに動的な性質を与える関数を構築し、代数と力学の側面を結びつける枠組みを提案するものである。

Joe Pratt-Johns (Edinburgh Napier University), Toby St. Clere Smithe (Kodamai Ltd), Chris Guiver (Edinburgh Napier University), Kevin Hughes (Edinburgh Napier University), Peter Andras (Edinburgh Napier University)2026-03-11💻 cs

GIIM: Graph-based Learning of Inter- and Intra-view Dependencies for Multi-view Medical Image Diagnosis

本論文は、医療画像診断における単一ビュー内の異常間の依存関係と複数ビュー間の動的変化を同時にモデル化し、欠損データにも頑健な新しいグラフベースの学習フレームワーク「GIIM」を提案し、その有効性を CT、MRI、マンモグラフィーなど多様な画像モダリティで実証したものである。

Tran Bao Sam, Hung Vu, Dao Trung Kien, Tran Dat Dang, Van Ha Tang, Steven Truong2026-03-11💻 cs

ShapeMark: Robust and Diversity-Preserving Watermarking for Diffusion Models

この論文は、拡散モデルの出力に対する知的財産保護の課題に対し、ノイズの構造パターンに透かし情報を符号化し、かつノイズ要素の位置をランダム化することで、既存手法の弱点であった頑健性と生成多様性の両立を実現する「ShapeMark」という新しい透かし手法を提案しています。

Yuqi Qian, Yun Cao, Haocheng Fu, Meiyang Lv, Meineng Zhu2026-03-11💻 cs

Stein Variational Ergodic Surface Coverage with SE(3) Constraints

本論文は、複雑な 3 次元表面の包括的なカバレッジと SE(3) 制約の厳密な維持を両立させるため、事前条件付き SE(3) スティーン変分勾配降下法を用いた新しいサンプリングベースの軌道最適化手法を提案し、シミュレーションおよび実機実験において既存手法を上回る性能を実証しています。

Jiayun Li, Yufeng Jin, Sangli Teng, Dejian Gong, Georgia Chalvatzaki2026-03-11💻 cs

SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments

この論文は、可微分制御バリア関数に基づく安全シールドや適応的衝突再生メカニズムを導入した強化学習フレームワーク「SEA-Nav」を提案し、実世界における複雑で密な障害物環境での四足歩行ロボットの安全かつ俊敏なナビゲーションを、わずか数分間のトレーニング時間で実現したことを報告しています。

Shiyi Chen, Mingye Yang, Haiyan Mao, Jiaqi Zhang, Haiyi Liu, Shuheng He, Debing Zhang, Zihao Qiu, Chun Zhang2026-03-11💻 cs

TopoOR: A Unified Topological Scene Representation for the Operating Room

既存の手術室シーングラフが抱える構造的な限界を克服するため、本論文は、手術室の複雑な多様体幾何学と高次関係を本質的に保持する新しいトポロジカルな表現「TopoOR」を提案し、多様なモダリティを統合した単一の潜在空間に落とし込むことなく、滅菌違反検出やロボット動作予測などの安全上重要な推論において従来の手法を上回る性能を実現することを示しています。

Tony Danjun Wang, Ka Young Kim, Tolga Birdal, Nassir Navab, Lennart Bastian2026-03-11💻 cs

Experience Report on the Adaptable Integration of Requirements Engineering Courses into Curricula for Professionals

この論文は、技術環境の変化やスキル要件の進化に伴い需要が高まる専門職向けソフトウェア工学教育において、要件工学コースを効果的に統合するための基本原則と、カリキュラム開発における経験に基づいた体系的なアプローチ(コース内容のマッピングに焦点を当てた手法)を報告するものである。

Oleksandr Kosenkov, Konstantin Blaschke, Tony Gorschek, Michael Unterkalmsteiner, Oleksandr Adamov, Davide Fucci2026-03-11💻 cs

The Patrologia Graeca Corpus: OCR, Annotation, and Open Release of Noisy Nineteenth-Century Polytonic Greek Editions

本論文は、19 世紀の複雑な二言語レイアウトと劣化したポリトニック文字を特徴とする『パトロロギア・グラエカ』の未デジタル化巻を対象に、YOLO と CRNN を組み合わせた専用パイプラインにより高精度な OCR を実現し、約 600 万トークンの注釈付きコーパスをオープンリリースするとともに、ノイズの多いポリトニック・ギリシャ語の OCR における新たなベンチマークを確立したことを報告するものである。

Chahan Vidal-Gorène (CJM, LIPN), Bastien Kindt2026-03-11💻 cs

OmniEarth: A Benchmark for Evaluating Vision-Language Models in Geospatial Tasks

本論文は、地球観測における視覚言語モデル(VLM)の性能を包括的に評価するための新しいベンチマーク「OmniEarth」を提案し、知覚・推論・頑健性の 3 つの次元で 28 のタスクを定義し、既存モデルが地理空間的に複雑なタスクにおいて依然として課題を抱えていることを示しています。

Ronghao Fu, Haoran Liu, Weijie Zhang, Zhiwen Lin, Xiao Yang, Peng Zhang, Bo Yang2026-03-11💻 cs

MORE-R1: Guiding LVLM for Multimodal Object-Entity Relation Extraction via Stepwise Reasoning with Reinforcement Learning

本論文は、視覚オブジェクトとテキストエンティティ間の関係抽出タスク(MORE)において、既存手法の限界を克服し、教師あり微調整(SFT)による高品質な段階的推論データセットの構築と、グループ相対方策最適化(GRPO)を用いた強化学習を組み合わせることで、大規模視覚言語モデル(LVLM)の推論能力を飛躍的に向上させ、最先端の性能を達成した「MORE-R1」を提案するものです。

Xiang Yuan, Xu Chu, Xinrong Chen, Haochen Li, Zonghong Dai, Hongcheng Fan, Xiaoyue Yuan, Weiping Li, Tong Mo2026-03-11💻 cs

Prune Redundancy, Preserve Essence: Vision Token Compression in VLMs via Synergistic Importance-Diversity

本論文は、視覚トークンの冗長性を削減しつつ本質的な情報を保持するために、意味的クラスタリングとグループ内非最大値抑制を組み合わせたトレーニング不要の手法「PruneSID」を提案し、LLaVA シリーズなど多様な VLM において既存手法を上回る高精度と高速推論を実現したことを報告するものです。

Zhengyao Fang, Pengyuan Lyu, Chengquan Zhang, Guangming Lu, Jun Yu, Wenjie Pei2026-03-11💻 cs

StyleVLA: Driving Style-Aware Vision Language Action Model for Autonomous Driving

本論文は、物理的制約を考慮したハイブリッド損失関数と大規模なスタイル別指令データセットを活用し、Qwen3-VL-4B を基盤とした「StyleVLA」を提案することで、既存の VLA モデルや Gemini-3-Pro などのプロプライエタリモデルを上回る、多様な運転スタイルと物理的実現性を兼ね備えた自律運転を実現する手法を提示しています。

Yuan Gao, Dengyuan Hua, Mattia Piccinini, Finn Rasmus Schäfer, Korbinian Moller, Lin Li, Johannes Betz2026-03-11💻 cs

Component-Aware Sketch-to-Image Generation Using Self-Attention Encoding and Coordinate-Preserving Fusion

この論文は、自己注意エンコーディングと座標保持融合を用いたコンポーネント意識型の自己洗練フレームワークを提案し、既存の GAN や拡散モデルを上回る高忠実度かつ高品質なスケッチから画像への生成を実現するものである。

Ali Zia, Muhammad Umer Ramzan, Usman Ali, Muhammad Faheem, Abdelwahed Khamis, Shahnawaz Qureshi2026-03-11💻 cs

Streaming Autoregressive Video Generation via Diagonal Distillation

本論文は、時間的依存関係の活用不足と露出バイアスを解決するため、非対称な生成戦略と暗黙的なオプティカルフローモデリングを組み合わせた「対角蒸留(Diagonal Distillation)」を提案し、高品質な動画ストリーミング生成をリアルタイム(最大 31 FPS)で実現する手法を開発しました。

Jinxiu Liu, Xuanming Liu, Kangfu Mei, Yandong Wen, Ming-HsuanYang, Weiyang Liu2026-03-11💻 cs