eess.IV 篇论文 | Gist.Science

Evaluating quality metrics through the lenses of psychophysical measurements of low-level vision

本文提出了一套基于对比敏感度、对比掩蔽和对比匹配等低层视觉心理物理原理的测试框架，用于评估 34 种现有图像和视频质量指标在模拟人类视觉感知方面的能力，并揭示了它们在预测特定视觉特性时的优势与局限。

Dounia Hammou, Yancheng Cai, Pavan Madhusudanarao, Christos G. Bampis, Rafał K. MantiukMon, 09 Ma💻 cs

Multivariate Fields of Experts for Convergent Image Reconstruction

本文提出了一种基于 $\ell_\infty$ -范数 Moreau 包络构建多元势函数的“多元专家场”新框架，用于图像先验学习，该模型在图像去噪、去模糊及压缩感知 MRI 等多种逆问题中，不仅性能优于传统单变量模型并接近深度学习正则化方法，还兼具训练数据需求少、参数少、速度快、可解释性强以及拥有理论收敛保证等优势。

Stanislas Ducotterd, Michael UnserMon, 09 Ma🤖 cs.LG

SAAIPAA: Optimizing aspect-angles-invariant physical adversarial attacks on SAR target recognition models

该论文提出了 SAR 视角不变物理对抗攻击（SAAIPAA）框架，通过物理建模优化角反射器布局，使攻击者在未知 SAR 平台视角的情况下仍能实现对目标识别模型的高效物理欺骗。

Isar Lemeire, Yee Wei Law, Sang-Heon Lee, William Meakin, Tat-Jun ChinMon, 09 Ma⚡ eess

Learning Latent Transmission and Glare Maps for Lens Veiling Glare Removal

该论文提出了 VeilGen 生成模型与 DeVeiler 恢复网络，通过无监督学习潜在透射与眩光图来模拟并去除简化光学系统中的镜头光幕眩光，从而在无需配对数据的情况下实现了高质量的图像复原。

Xiaolong Qian, Qi Jiang, Lei Sun, Zongxi Yu, Kailun Yang, Peixuan Wu, Jiacheng Zhou, Yao Gao, Yaoguang Ma, Ming-Hsuan Yang, Kaiwei WangMon, 09 Ma🔬 physics.optics

In-batch Relational Features Enhance Precision in An Unsupervised Medical Anomaly Detection Task

该论文提出了一种通过批处理超图估计和共享权重图卷积层增强 CNN 自编码器潜在表示的无监督医学异常检测方法，利用正常队列的上下文相似性生成群体感知嵌入，从而在脑肿瘤 MRI 数据集上显著降低了假阳性率并提升了检测精度。

P. Bilha Githinji, Xi Yuan, Ijaz Gul, Lian Zhang, Jinhao Xu, Zhenglin Chen, Peiwu Qin, Dongmei YuMon, 09 Ma🧬 q-bio

Clinical-Injection Transformer with Domain-Adapted MAE for Lupus Nephritis Prognosis Prediction

本文提出了一种结合临床特征注入 Transformer 与领域自适应掩码自编码器的多模态计算病理框架，仅利用常规 PAS 染色活检和临床数据，在儿童狼疮性肾炎预后预测中实现了高达 90.1% 的三类准确率。

Yuewen Huang, Zhitao Ye, Guangnan Feng, Fudan Zheng, Xia Gao, Yutong LuMon, 09 Ma🤖 cs.LG

Edges Are All You Need: Robust Gait Recognition via Label-Free Structure

该论文提出了一种名为 SKETCHGAIT 的鲁棒步态识别框架，通过引入无需标签的“素描”（SKETCH）模态来提取高频结构线索，并结合多模态解耦融合策略，有效克服了传统轮廓和解析方法在判别力与稳定性上的局限，在多个数据集上取得了领先的识别性能。

Chao Zhang, Zhuang Zheng, Ruixin Li, Zhanyong MeiMon, 09 Ma💻 cs

Privacy-Preserving Collaborative Medical Image Segmentation Using Latent Transform Networks

本文提出了一种名为 PPCMI-SF 的隐私保护协作医疗图像分割框架，该框架通过结合跳连自编码器与客户端特定的密钥潜在变换，在无需共享原始数据的前提下，实现了多机构间的高精度、抗攻击且低通信开销的实时分割任务。

Saheed Ademola Bello, Muhammad Shahid Jabbar, Muhammad Sohail Ibrahim, Shujaat KhanMon, 09 Ma💻 cs

Gabor Primitives for Accelerated Cardiac Cine MRI Reconstruction

该论文提出了一种利用调制高斯包络以在任意 k 空间位置放置频谱支持的 Gabor 基元方法，结合低秩时空分解，实现了无需大规模训练数据即可从高度欠采样数据中高效重建具有物理可解释参数的高分辨率心脏电影 MRI 图像，其性能优于压缩感知、高斯基元及哈希网格隐式神经表示等现有基线。

Wenqi Huang, Veronika Spieker, Nil Stolt-Ansó, Natascha Niessen, Maik Dannecker, Sevgi Gokce Kafali, Sila Kurugol, Julia A. Schnabel, Daniel RueckertMon, 09 Ma💻 cs

Longitudinal Lesion Inpainting in Brain MRI via 3D Region Aware Diffusion

该论文提出了一种基于区域感知扩散模型的伪 3D 纵向脑 MRI 病灶修复框架，通过融合多时相上下文信息，在显著提升图像感知保真度与纵向稳定性的同时，实现了比现有最先进方法快约 10 倍的修复效率。

Zahra Karimaghaloo, Dumitru Fetco, Haz-Edine Assemlal, Hassan Rivaz, Douglas L. ArnoldMon, 09 Ma🤖 cs.AI

Interpretable Motion Artificat Detection in structural Brain MRI

本文提出了一种轻量级且可解释的三维判别直方图梯度幅值（DHoGM）框架，通过融合切片级与体素级特征及低参数分类器，实现了在跨站点条件下对结构脑 MRI 运动伪影的高效、准确且鲁棒的自动检测。

Naveetha Nithianandam, Prabhjot Kaur, Anil Kumar SaoMon, 09 Ma💻 cs

Uni-LVC: A Unified Method for Intra- and Inter-Mode Learned Video Compression

本文提出了 Uni-LVC，一种通过跨注意力适配模块和可靠性感知分类器，将帧间编码统一为基于参考帧条件化的帧内编码的单一模型，从而在低延迟和随机访问模式下同时实现高效且鲁棒的视频压缩。

Yichi Zhang, Ruoyu Yang, Fengqing ZhuMon, 09 Ma💻 cs

Architectural Unification for Polarimetric Imaging Across Multiple Degradations

本文提出了一种统一的极化成像架构框架，通过单阶段联合图像与斯托克斯域处理，在无需针对每种退化类型重新设计网络结构的情况下，实现了去噪、去模糊和去马赛克等任务中物理一致且最先进的恢复性能。

Chu Zhou, Yufei Han, Junda Liao, Linrui Dai, Wangze Xu, Art Subpa-Asa, Heng Guo, Boxin Shi, Imari SatoMon, 09 Ma💻 cs

Technical Report: Automated Optical Inspection of Surgical Instruments

该报告通过与巴基斯坦 Sialkot 地区行业领袖合作，利用包含 4,414 张高分辨率图像的新数据集，结合 YOLOv8、ResNet-152 和 EfficientNet-b4 等深度学习架构，开发自动化光学检测系统以识别和修复手术器械缺陷，从而提升制造标准并保障患者安全。

Zunaira Shafqat, Atif Aftab Ahmed Jilani, Qurrat Ul AinMon, 09 Ma🤖 cs.AI

Enhancing Neural Video Compression of Static Scenes with Positive-Incentive Noise

该论文提出了一种针对静态场景视频的神经视频压缩新方法，通过引入“正向激励噪声”将短期时序变化与持久背景解耦，在保持像素级保真度的同时显著降低了数据传输量，实现了计算与带宽的高效权衡。

Cheng Yuan, Zhenyu Jia, Jiawei Shao, Xuelong LiMon, 09 Ma💻 cs

NOVA: Next-step Open-Vocabulary Autoregression for 3D Multi-Object Tracking in Autonomous Driving

本文提出了名为 NOVA 的新范式，利用大型语言模型的自回归能力将 3D 多目标跟踪重构为生成式时空语义序列预测任务，从而在无需闭集假设的情况下显著提升了对未知目标的泛化跟踪性能。

Kai Luo, Xu Wang, Rui Fan, Kailun YangMon, 09 Ma💻 cs

Can we Trust Unreliable Voxels? Exploring 3D Semantic Occupancy Prediction under Label Noise

该论文针对真实世界中 3D 语义占据预测面临的标注噪声问题，首次建立了 OccNL 基准并揭示了现有 2D 去噪策略在稀疏 3D 空间中的失效，进而提出了基于双源部分标签推理的 DPR-Occ 框架，在极端噪声下显著提升了感知鲁棒性。

Wenxin Li, Kunyu Peng, Di Wen, Junwei Zheng, Jiale Wei, Mengfei Duan, Yuheng Zhang, Rui Fan, Kailun YangMon, 09 Ma💻 cs

AI End-to-End Radiation Treatment Planning Under One Second

该论文介绍了一种名为 AIRT 的端到端深度学习框架，它能在单块 Nvidia A100 GPU 上不到一秒的时间内，直接从 CT 图像和结构轮廓生成前列腺 VMAT 放疗计划，并在靶区覆盖度和器官保护等关键指标上展现出与 RapidPlan Eclipse 相当的非劣效性。

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin ComaniciuMon, 09 Ma🤖 cs.AI

EquivAnIA: A Spectral Method for Rotation-Equivariant Anisotropic Image Analysis

本文提出了一种名为 EquivAnIA 的新型谱方法，利用蛋糕小波和脊滤波器进行各向异性图像分析，该方法在合成及真实图像实验中展现出对数值旋转的鲁棒性，并成功应用于角度图像配准任务。

Jérémy Scanvic, Nils LaurentFri, 13 Ma⚡ eess

Hybrid eTFCE-GRF: Exact Cluster-Size Retrieval with Analytical p-Values for Voxel-Based Morphometry

该论文提出了一种结合精确聚类大小检索与高斯随机场解析推断的混合 eTFCE-GRF 方法，在无需置换检验的情况下实现了体素形态学分析中严格的族错误率控制，并将计算速度提升了数十至千倍。

Don Yin, Hao Chen, Takeshi Miki, Boxing Liu, Enyu YangFri, 13 Ma⚡ eess