No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

该论文提出了名为 k-MTR 的 k 空间多任务表示学习框架,通过在大规模模拟数据上构建 k 空间与全采样图像的共享语义流形,实现了从欠采样 k 空间数据直接进行心脏 MRI 的连续表型回归、疾病分类和解剖分割,从而突破了传统“先重建后分析”范式的局限。

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

Leveraging whole slide difficulty in Multiple Instance Learning to improve prostate cancer grading

该论文提出了一种基于专家与非专家病理学家诊断分歧的“全切片难度”(WSD)概念,并通过多任务学习和加权分类损失两种方法将其融入前列腺癌 Gleason 分级任务中,实验结果表明该方法能显著提升不同特征编码器和多实例学习模型的性能,尤其改善了对高 Gleason 分级(即更严重病情)的分类效果。

Marie Arrivat, Rémy Peyret, Elsa Angelini, Pietro Gori2026-03-11💻 cs

Differentiable Microscopy Designs an All Optical Phase Retrieval Microscope

该论文提出了名为“可微显微镜”(μ\partial\mu)的自上而下设计框架,通过数据驱动方法成功优化了全光学相位检索系统,并在多个数据集及实验验证中证明了其优于现有方法的性能。

Kithmini Herath, Hasindu Kariyawasam, Ramith Hettiarachchi, Udith Haputhanthri, Dineth Jayakody, Raja N. Ahmad, Azeem Ahmad, Balpreet S. Ahluwalia, Chamira U. S. Edussooriya, Dushan N. Wadduwage2026-03-10🔬 physics.optics

Deepfake Generation and Detection: A Benchmark and Survey

本文全面综述了深度伪造生成与检测领域的最新进展,统一了任务定义、数据集与评估指标,系统分析了换脸、表情重演、说话人脸生成、面部属性编辑及伪造检测等四个代表性方向,并通过基准测试评估了主流方法,最后探讨了该领域面临的挑战与未来研究方向。

Gan Pei, Jiangning Zhang, Menghan Hu, Zhenyu Zhang, Chengjie Wang, Yunsheng Wu, Guangtao Zhai, Jian Yang, Dacheng Tao2026-03-10💻 cs

Goldilocks Test Sets for Face Verification

该论文指出当前人脸识别测试集存在瓶颈,并提出了三个高质量、无需人工降质的挑战性测试集(Hadrian、Eclipse 和 ND-Twins),旨在通过考察属性差异、相似面孔及严格的“金发姑娘”平衡规则,揭示现有算法在识别具有显著属性差异的同一身份、属性相似的不同身份以及相似面孔(如双胞胎)时的弱点。

Haiyu Wu, Sicong Tian, Aman Bhatta, Jacob Gutierrez, Grace Bezold, Genesis Argueta, Karl Ricanek Jr., Michael C. King, Kevin W. Bowyer2026-03-10💻 cs

ExpGest: Expressive Speaker Generation Using Diffusion Model and Hybrid Audio-Text Guidance

本文提出了 ExpGest 框架,这是一种基于扩散模型的首创性全肢体手势生成方法,通过融合音频与文本信息、引入噪声情感分类器及潜在空间对齐技术,有效解决了现有方法在情感表达、语义一致性和全身运动自然度方面的不足,实现了更具表现力和可控性的演讲者动作生成。

Yongkang Cheng, Mingjiang Liang, Shaoli Huang, Gaoge Han, Jifeng Ning, Wei Liu2026-03-10💻 cs