Cross-Resolution Distribution Matching for Diffusion Distillation

该论文提出了一种名为 RMD 的跨分辨率分布匹配蒸馏框架,通过利用对数信噪比映射和预测噪声重注入机制,有效弥合了跨分辨率分布差异,从而在保持高视觉保真度的同时,显著加速了扩散模型的推理过程(如在 SDXL 和 Wan2.1-14B 上分别实现了高达 33.4 倍和 25.6 倍的加速)。

Feiyang Chen, Hongpeng Pan, Haonan Xu, Xinyu Duan, Yang Yang, Zhefeng Wang2026-03-09💻 cs

Longitudinal NSCLC Treatment Progression via Multimodal Generative Models

该论文提出了一种名为虚拟治疗(VT)的多模态生成框架,通过结合 CT 影像、临床变量及辐射剂量增量来模拟非小细胞肺癌(NSCLC)在放疗期间的纵向演变,并验证了基于扩散模型的方案在生成解剖学上更合理且稳定的肿瘤演化轨迹方面优于 GAN 基线,从而为 NSCLC 的虚拟治疗监测和自适应放疗研究提供了有力工具。

Massimiliano Mantegna, Elena Mulero Ayllón, Alice Natalina Caragliano, Francesco Di Feola, Claudia Tacconi, Michele Fiore, Edy Ippolito, Carlo Greco, Sara Ramella, Philippe C. Cattin, Paolo Soda, Matteo Tortora, Valerio Guarrasi2026-03-09💻 cs

A Semi-Supervised Framework for Breast Ultrasound Segmentation with Training-Free Pseudo-Label Generation and Label Refinement

该论文提出了一种无需训练伪标签生成与标签精化的半监督框架,通过利用视觉语言模型基于外观描述跨域生成结构一致的伪标签,并结合不确定性加权融合与反向对比学习,在仅使用 2.5% 标注数据的情况下实现了与全监督模型相当的乳腺超声图像分割性能。

Ruili Li, Jiayi Ding, Ruiyu Li, Yilun Jin, Shiwen Ge, Yuwen Zeng, Xiaoyong Zhang, Eichi Takaya, Jan Vrba, Noriyasu Homma2026-03-09💻 cs

JOPP-3D: Joint Open Vocabulary Semantic Segmentation on Point Clouds and Panoramas

本文提出了 JOPP-3D 框架,通过联合利用全景图像与点云数据并转换对齐基础视觉 - 语言特征,实现了在数据稀缺场景下基于自然语言查询的 3D 点云与全景图像开放词汇语义分割,并在多个数据集上显著超越了现有最先进方法。

Sandeep Inuganti, Hideaki Kanayama, Kanta Shimizu, Mahdi Chamseddine, Soichiro Yokota, Didier Stricker, Jason Rambach2026-03-09💻 cs

Towards Motion Turing Test: Evaluating Human-Likeness in Humanoid Robots

该论文提出了受图灵测试启发的“运动图灵测试”框架及包含 1000 个动作序列的 HHMotion 数据集,通过消除视觉外观干扰的纯运动学评估,揭示了当前人形机器人在动态动作中仍与人类存在显著差异,并证明了专用基线模型在预测运动拟人度方面优于多模态大语言模型。

Mingzhe Li, Mengyin Liu, Zekai Wu, Xincheng Lin, Junsheng Zhang, Ming Yan, Zengye Xie, Changwang Zhang, Chenglu Wen, Lan Xu, Siqi Shen, Cheng Wang2026-03-09💻 cs

CRIMSON: A Clinically-Grounded LLM-Based Metric for Generative Radiology Report Evaluation

本文提出了 CRIMSON,这是一种基于临床指南的大语言模型评估框架,通过引入患者背景信息、细粒度的错误分类及基于临床重要性的加权机制,在诊断正确性、上下文相关性和患者安全性方面实现了对胸部 X 光报告生成任务更精准且与放射科专家判断高度一致的评估。

Mohammed Baharoon, Thibault Heintz, Siavash Raissi, Mahmoud Alabbad, Mona Alhammad, Hassan AlOmaish, Sung Eun Kim, Oishi Banerjee, Pranav Rajpurkar2026-03-09🤖 cs.AI