GOLDMARK: Governed Outcome-Linked Diagnostic Model Assessment Reference Kit

本文介绍了 GOLDMARK,这是一个基于 TCGA 和 MSKCC 队列构建的标准化基准框架,旨在通过提供结构化中间数据、预训练模型及统一评估指标,解决计算病理学在临床级部署中缺乏标准化和可复现性的问题,并验证了其在特定形态 - 基因组关联任务中的稳健性能。

Chad Vanderbilt, Gabriele Campanella, Siddharth Singi, Swaraj Nanda, Jie-Fu Chen, Ali Kamali, Amir Momeni Boroujeni, David Kim, Mohamed Yakoub, Jamal Benhamida, Meera Hameed, Neeraj Kumar, Gregory Gol (…)2026-03-24🧬 q-bio

Glove2Hand: Synthesizing Natural Hand-Object Interaction from Multi-Modal Sensing Gloves

该论文提出了 Glove2Hand 框架,通过结合新型 3D 高斯手部模型与基于扩散的手部修复技术,将多模态传感手套视频转化为保留物理交互动态的逼真裸手视频,并发布了首个同步触觉与 IMU 信号的手 - 物交互数据集 HandSense,显著提升了接触估计和遮挡下的手部追踪等下游任务性能。

Xinyu Zhang, Ziyi Kou, Chuan Qin, Mia Huang, Ergys Ristani, Ankit Kumar, Lele Chen, Kun He, Abdeslam Boularias, Li Guan2026-03-24💻 cs

Ensemble of Small Classifiers For Imbalanced White Blood Cell Classification

该论文提出了一种基于轻量级预训练模型(SwinV2-Tiny、DinoBloom-Small 和 ConvNeXT-V2-Tiny)的集成学习方法,通过数据集扩展和模型集成策略,有效解决了白细胞分类中因染色差异、扫描变化及患者异质性导致的罕见细胞类型不平衡问题,从而实现了对白血病诊断的高效自动化。

Siddharth Srivastava, Adam Smith, Scott Brooks, Jack Bacon, Till Bretschneider2026-03-24🤖 cs.LG

Scene Graph-guided SegCaptioning Transformer with Fine-grained Alignment for Controllable Video Segmentation and Captioning

该论文提出了一种名为 SG-FSCFormer 的新框架,通过场景图引导和细粒度对齐机制,实现了用户可交互的“分割 - 描述”任务,能够根据边界框等提示同时生成精确的视频分割掩码和对应描述,从而显著提升视频内容的可控理解能力。

Xu Zhang, Jin Yuan, BinHong Yang, Xuan Liu, Qianjun Zhang, Yuyi Wang, Zhiyong Li, Hanwang Zhang2026-03-24💻 cs

GraPHFormer: A Multimodal Graph Persistent Homology Transformer for the Analysis of Neuroscience Morphologies

本文提出了 GraPHFormer,一种结合 CLIP 式对比学习、多通道持久图像编码与 TreeLSTM 图结构编码的多模态 Transformer 架构,通过统一拓扑与几何视角,在多个神经形态学基准测试中实现了最先进的性能,并有效应用于胶质细胞分类及发育与退化过程的检测。

Uzair Shah, Marco Agus, Mahmoud Gamal, Mahmood Alzubaidi, Corrado Cali, Pierre J. Magistretti, Abdesselam Bouzerdoum, Mowafa Househ2026-03-24💻 cs