SemVideo: Reconstructs What You Watch from Brain Activity via Hierarchical Semantic Guidance

本論文は、静的なアノテーション、運動指向のナラティブ、包括的な要約という3段階の階層的な意味情報を用いてfMRI信号から一貫性のある動画を再構築する新手法「SemVideo」を提案し、CC2017およびHCPデータセットにおいて既存手法を上回る性能を達成したことを報告しています。

Minghan Yang, Lan Yang, Ke Li + 3 more2026-03-02🤖 cs.AI

GFRRN: Explore the Gaps in Single Image Reflection Removal

本論文は、事前学習モデルと反射除去モデル間の意味的ギャップやデータラベルの不一致といった課題を克服するため、パラメータ効率型微調整やラベル生成、適応的周波数学習、動的エージェントアテンションを組み合わせた「GFRRN」を提案し、単一画像からの反射除去において最先端の性能を達成したことを示しています。

Yu Chen, Zewei He, Xingyu Liu + 2 more2026-03-02💻 cs

WARM-CAT: Warm-Started Test-Time Comprehensive Knowledge Accumulation for Compositional Zero-Shot Learning

本論文は、テスト時に分布シフトに対処し、教師なしデータからテキストおよび視覚モダリティの知識を蓄積してマルチモーダルプロトタイプを適応的に更新する「WARM-CAT」という手法を提案し、新しいデータセット C-Fashion の導入と既存データセットの整備を通じて、構成ゼロショット学習において最先端の性能を達成したことを報告しています。

Xudong Yan, Songhe Feng, Jiaxin Wang + 2 more2026-03-02💻 cs

Motion-aware Event Suppression for Event Cameras

本論文は、IMU や自己運動によって引き起こされるイベントをリアルタイムで予測・抑制する初のフレームワークを提案し、セグメンテーション精度の大幅な向上と軽量な推論速度を実現するとともに、ビジョントランスフォーマーの推論加速や視覚オドメトリの精度向上など、下流タスクへの顕著な効果を実証しています。

Roberto Pellerito, Nico Messikommer, Giovanni Cioffi + 2 more2026-03-02💻 cs

Analytical Expression for Spherically Symmetric Photoacoustic Sources: A Unified General Solution (Theoretical Analysis and Derivation)

本論文では、球対称な初期圧力分布を持つ光音響源から発生する音圧の空間時間的分布を記述する統一的な解析解を導出するとともに、代表的な分布に対する具体的な式や遠方近似を提示し、その実装コードを公開して光音響イメージングシステムの設計と信号解析に貢献しています。

Shuang Li, Yibing Wang, Yu Zhang + 1 more2026-03-02🔬 physics.optics

Demystifying Action Space Design for Robotic Manipulation Policies

本論文は、13,000 回以上の実世界ロボット操作データに基づく大規模な実証研究により、ロボットの模倣学習における行動空間設計が学習性能に決定的な影響を与えることを明らかにし、デルタ動作の予測や関節空間・タスク空間の適切な組み合わせが、制御の安定性と汎化性能の向上に寄与することを示しています。

Yuchun Feng, Jinliang Zheng, Zhihao Wang + 5 more2026-03-02💻 cs

DesignSense: A Human Preference Dataset and Reward Modeling Framework for Graphic Layout Generation

本論文は、グラフィックレイアウト生成における人間の美的判断との整合性を高めるため、大規模な人間評価データセット「DesignSense-10k」と、既存のモデルを大幅に上回る性能を持つ報酬モデル「DesignSense」を提案し、これらが生成モデルの品質向上に実用的な効果をもたらすことを示しています。

Varun Gopal, Rishabh Jain, Aradhya Mathur + 6 more2026-03-02🤖 cs.AI

SALIENT: Frequency-Aware Paired Diffusion for Controllable Long-Tail CT Detection

SALIENT は、離散ウェーブレット係数を用いた周波数意識型の拡散モデルと学習可能な目的関数を導入することで、CT 画像における極端なクラス不均衡と長尾分布の問題を解決し、制御可能な合成データ生成を通じて検出精度を大幅に向上させる新しいフレームワークです。

Yifan Li, Mehrdad Salimitari, Taiyu Zhang + 2 more2026-03-02⚡ eess

SGDC: Structurally-Guided Dynamic Convolution for Medical Image Segmentation

本論文は、平均プーリングによる高周波情報の損失を回避し、補助的な構造抽出ブランチからの高忠実な境界情報を活用して動的カーネルを生成する「構造誘導型動的畳み込み(SGDC)」を提案し、医療画像セグメンテーションにおける境界の忠実度と精度を大幅に向上させることを示しています。

Bo Shi, Wei-ping Zhu, M. N. S. Swamy2026-03-02⚡ eess

SegReg: Latent Space Regularization for Improved Medical Image Segmentation

本論文は、U-Net の潜在空間に正則化を導入する「SegReg」を提案し、nnU-Net と統合することで医療画像セグメンテーションのドメイン汎化性能を向上させるとともに、追加パラメータやメモリなしで継続学習におけるタスクドリフトを抑制し前方転移を促進することを示しています。

Puru Vaish, Amin Ranem, Felix Meister + 3 more2026-03-02⚡ eess

Modelling and Simulation of Neuromorphic Datasets for Anomaly Detection in Computer Vision

本論文は、イベントベースのコンピュータビジョン研究におけるデータ不足を解消するため、Unity エンジン上で構築され、統計的プロセスに基づいて任意のサンプル数と異常ラベルを持つカスタムなニューロモルフィック視覚データセットを生成できる新しいシミュレーションフレームワーク「ANTShapes」を提案するものである。

Mike Middleton, Teymoor Ali, Hakan Kayan + 6 more2026-03-02🤖 cs.LG

All in One: Unifying Deepfake Detection, Tampering Localization, and Source Tracing with a Robust Landmark-Identity Watermark

この論文は、顔のランドマークとソース識別子を構造的に統合した 152 次元の「LIDMark」と呼ばれる新しい透かし技術と、それを堅牢に復元する Factorized-Head Decoder を採用することで、ディープフェイクの検出、改ざん箇所の特定、および出所追跡という 3 つのタスクを単一の統合フレームワークで実現する手法を提案しています。

Junjiang Wu, Liejun Wang, Zhiqing Guo2026-03-02💻 cs

Few-Shot Continual Learning for 3D Brain MRI with Frozen Foundation Models

本論文は、3D 脳 MRI 画像における少数ショット継続学習において、事前学習済み基盤モデルのバックボーンを凍結し、タスク固有の低ランク適応(LoRA)モジュールのみを学習させることで、カタストロフィック・フォージングを排除しつつ複数のタスクを効率的に維持する手法を提案し、その有効性を示しています。

Chi-Sheng Chen, Xinyu Zhang, Guan-Ying Chen + 3 more2026-03-02⚡ eess