cs 件の論文 | Gist.Science

Training-Free Coverless Multi-Image Steganography with Access Control

この論文は、拡散モデルの潜在空間融合とランダム基底メカニズムを活用し、既存のトレーニング不要なカバレス隠蔽法を凌駕する画質、多様性、耐ノイズ性、そしてステガノ分析への耐性を備えつつ、ユーザーごとのアクセス制御を可能にする新しいフレームワーク「MIDAS」を提案するものである。

Minyeol Bae, Si-Hyeon Lee2026-03-11💻 cs

GeoBenchr: An Application-Centric Benchmarking Suite for Spatiotemporal Database Platforms

本論文は、サイクリングや航空、海事追跡などの実世界のユースケースを反映し、スケーラビリティや設定の影響、プラットフォーム間の性能比較を含む包括的な評価を可能にする、オープンソースのアプリケーション中心時空間データベースベンチマークスイート「GeoBenchr」を提案するものである。

Tim C. Rese, Nils Japke, Diana Baumann, Natalie Carl, David Bermbach2026-03-11💻 cs

Vision-Augmented On-Track System Identification for Autonomous Racing via Attention-Based Priors and Iterative Neural Correction

本論文は、視覚情報を摩擦の事前知識として活用し、S4 モデルで動的残差を補正するハイブリッド手法を提案することで、自律レーシングにおけるタイヤ動力学の同定精度と冷間起動時の収束速度を大幅に向上させることを示しています。

Zhiping Wu, Cheng Hu, Yiqin Wang, Lei Xie, Hongye Su2026-03-11💻 cs

YOLO-NAS-Bench: A Surrogate Benchmark with Self-Evolving Predictors for YOLO Architecture Search

この論文は、YOLO 系オブジェクト検出器のニューラルアーキテクチャ探索における高コストな評価問題を解決するため、COCO-mini 上で学習した 1,500 個のアーキテクチャと、高性能領域に特化して自己進化するメカニズムにより精度を向上させた LightGBM 代理モデルを組み合わせた、初の YOLO 向け代理ベンチマーク「YOLO-NAS-Bench」を提案し、公式 YOLO バイアスを超えた高性能アーキテクチャの発見を実証しています。

Zhe Li, Xiaoyu Ding, Jiaxin Zheng, Yongtao Wang2026-03-11💻 cs

RiO-DETR: DETR for Real-time Oriented Object Detection

この論文は、向き付き物体検出の課題を解決し、リアルタイム性と高精度を両立する初の検出トランスフォーマー「RiO-DETR」を提案し、主要なデータセットで新たな速度と精度のトレードオフを確立したことを報告しています。

Zhangchi Hu, Yifan Zhao, Yansong Peng, Wenzhang Sun, Xiangchen Yin, Jie Chen, Peixi Wu, Hebei Li, Xinghao Wang, Dongsheng Jiang, Xiaoyan Sun2026-03-11💻 cs

The framework to unify all complexity dichotomy theorems for Boolean tensor networks

本論文は、ブールテンソルネットワークの複雑性二分定理を統合する包括的な枠組みを提案し、未解決問題が複素数上の 2 次元行列で構成される有限群として分類され、その 9 つのケースについて行列形式の簡略化や四元数部分群の障壁、循環群の場合の進展と解決を論じている。

Mingji Xia2026-03-11💻 cs

CIGPose: Causal Intervention Graph Neural Network for Whole-Body Pose Estimation

CIGPose は、視覚的コンテキストに起因する偽の相関を構造的因果モデルに基づいて特定し、予測不確実性を用いた因果介入モジュールと階層的グラフニューラルネットワークを組み合わせることで、解剖学的に妥当な全身ポーズ推定を実現し、COCO-WholeBody ベンチマークで新たな最先端性能を達成するフレームワークです。

Bohao Li, Zhicheng Cao, Huixian Li, Yangming Guo2026-03-11💻 cs

MetaDAT: Generalizable Trajectory Prediction via Meta Pre-training and Data-Adaptive Test-Time Updating

この論文は、メタ学習による事前学習と、テスト時のデータ特性に応じた学習率や更新頻度を動的に調整するデータ適応型メカニズムを導入することで、分布シフト下における軌道予測の性能を大幅に向上させる手法「MetaDAT」を提案しています。

Yuning Wang, Pu Zhang, Yuan He, Ke Wang, Jianru Xue2026-03-11💻 cs

An Analysis of Modern Web Security Vulnerabilities Inside WebAssembly Applications

この論文は、WebAssembly モジュールにおけるバッファオーバーフローなどのバイナリ脆弱性が、SQL インジェクションや XS-Leaks といった Web 固有のセキュリティ侵害を引き起こし、既存の防御策を無効化する可能性を示し、そのリスクを軽減するためのベストプラクティスを提案しています。

Lorenzo Corrias, Lorenzo Pisu, Davide Maiorca, Giorgio Giacinto2026-03-11💻 cs

First Steps towards Categorical Algebraic Artificial Chemistry

この論文は、人工生命の分野における Fontana と Buss の計算モデル「AlChemy」を一般化し、圏論を用いて代数的人工化学の相互作用コンポーネントに動的な性質を与える関数を構築し、代数と力学の側面を結びつける枠組みを提案するものである。

Joe Pratt-Johns (Edinburgh Napier University), Toby St. Clere Smithe (Kodamai Ltd), Chris Guiver (Edinburgh Napier University), Kevin Hughes (Edinburgh Napier University), Peter Andras (Edinburgh Napier University)2026-03-11💻 cs

GIIM: Graph-based Learning of Inter- and Intra-view Dependencies for Multi-view Medical Image Diagnosis

本論文は、医療画像診断における単一ビュー内の異常間の依存関係と複数ビュー間の動的変化を同時にモデル化し、欠損データにも頑健な新しいグラフベースの学習フレームワーク「GIIM」を提案し、その有効性を CT、MRI、マンモグラフィーなど多様な画像モダリティで実証したものである。

Tran Bao Sam, Hung Vu, Dao Trung Kien, Tran Dat Dang, Van Ha Tang, Steven Truong2026-03-11💻 cs

ShapeMark: Robust and Diversity-Preserving Watermarking for Diffusion Models

この論文は、拡散モデルの出力に対する知的財産保護の課題に対し、ノイズの構造パターンに透かし情報を符号化し、かつノイズ要素の位置をランダム化することで、既存手法の弱点であった頑健性と生成多様性の両立を実現する「ShapeMark」という新しい透かし手法を提案しています。

Yuqi Qian, Yun Cao, Haocheng Fu, Meiyang Lv, Meineng Zhu2026-03-11💻 cs

Stein Variational Ergodic Surface Coverage with SE(3) Constraints

本論文は、複雑な 3 次元表面の包括的なカバレッジと SE(3) 制約の厳密な維持を両立させるため、事前条件付き SE(3) スティーン変分勾配降下法を用いた新しいサンプリングベースの軌道最適化手法を提案し、シミュレーションおよび実機実験において既存手法を上回る性能を実証しています。

Jiayun Li, Yufeng Jin, Sangli Teng, Dejian Gong, Georgia Chalvatzaki2026-03-11💻 cs

SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments

この論文は、可微分制御バリア関数に基づく安全シールドや適応的衝突再生メカニズムを導入した強化学習フレームワーク「SEA-Nav」を提案し、実世界における複雑で密な障害物環境での四足歩行ロボットの安全かつ俊敏なナビゲーションを、わずか数分間のトレーニング時間で実現したことを報告しています。

Shiyi Chen, Mingye Yang, Haiyan Mao, Jiaqi Zhang, Haiyi Liu, Shuheng He, Debing Zhang, Zihao Qiu, Chun Zhang2026-03-11💻 cs

TopoOR: A Unified Topological Scene Representation for the Operating Room

既存の手術室シーングラフが抱える構造的な限界を克服するため、本論文は、手術室の複雑な多様体幾何学と高次関係を本質的に保持する新しいトポロジカルな表現「TopoOR」を提案し、多様なモダリティを統合した単一の潜在空間に落とし込むことなく、滅菌違反検出やロボット動作予測などの安全上重要な推論において従来の手法を上回る性能を実現することを示しています。

Tony Danjun Wang, Ka Young Kim, Tolga Birdal, Nassir Navab, Lennart Bastian2026-03-11💻 cs

Experience Report on the Adaptable Integration of Requirements Engineering Courses into Curricula for Professionals

この論文は、技術環境の変化やスキル要件の進化に伴い需要が高まる専門職向けソフトウェア工学教育において、要件工学コースを効果的に統合するための基本原則と、カリキュラム開発における経験に基づいた体系的なアプローチ（コース内容のマッピングに焦点を当てた手法）を報告するものである。

Oleksandr Kosenkov, Konstantin Blaschke, Tony Gorschek, Michael Unterkalmsteiner, Oleksandr Adamov, Davide Fucci2026-03-11💻 cs

The Patrologia Graeca Corpus: OCR, Annotation, and Open Release of Noisy Nineteenth-Century Polytonic Greek Editions

本論文は、19 世紀の複雑な二言語レイアウトと劣化したポリトニック文字を特徴とする『パトロロギア・グラエカ』の未デジタル化巻を対象に、YOLO と CRNN を組み合わせた専用パイプラインにより高精度な OCR を実現し、約 600 万トークンの注釈付きコーパスをオープンリリースするとともに、ノイズの多いポリトニック・ギリシャ語の OCR における新たなベンチマークを確立したことを報告するものである。

Chahan Vidal-Gorène (CJM, LIPN), Bastien Kindt2026-03-11💻 cs

OmniEarth: A Benchmark for Evaluating Vision-Language Models in Geospatial Tasks

本論文は、地球観測における視覚言語モデル（VLM）の性能を包括的に評価するための新しいベンチマーク「OmniEarth」を提案し、知覚・推論・頑健性の 3 つの次元で 28 のタスクを定義し、既存モデルが地理空間的に複雑なタスクにおいて依然として課題を抱えていることを示しています。

Ronghao Fu, Haoran Liu, Weijie Zhang, Zhiwen Lin, Xiao Yang, Peng Zhang, Bo Yang2026-03-11💻 cs

MORE-R1: Guiding LVLM for Multimodal Object-Entity Relation Extraction via Stepwise Reasoning with Reinforcement Learning

本論文は、視覚オブジェクトとテキストエンティティ間の関係抽出タスク（MORE）において、既存手法の限界を克服し、教師あり微調整（SFT）による高品質な段階的推論データセットの構築と、グループ相対方策最適化（GRPO）を用いた強化学習を組み合わせることで、大規模視覚言語モデル（LVLM）の推論能力を飛躍的に向上させ、最先端の性能を達成した「MORE-R1」を提案するものです。

Xiang Yuan, Xu Chu, Xinrong Chen, Haochen Li, Zonghong Dai, Hongcheng Fan, Xiaoyue Yuan, Weiping Li, Tong Mo2026-03-11💻 cs

Prune Redundancy, Preserve Essence: Vision Token Compression in VLMs via Synergistic Importance-Diversity

本論文は、視覚トークンの冗長性を削減しつつ本質的な情報を保持するために、意味的クラスタリングとグループ内非最大値抑制を組み合わせたトレーニング不要の手法「PruneSID」を提案し、LLaVA シリーズなど多様な VLM において既存手法を上回る高精度と高速推論を実現したことを報告するものです。

Zhengyao Fang, Pengyuan Lyu, Chengquan Zhang, Guangming Lu, Jun Yu, Wenjie Pei2026-03-11💻 cs

← 前へ次へ →