Multiple Inputs and Mixwd data for Alzheimer's Disease Classification Based on 3D Vision Transformer

该研究提出了一种名为 MIMD-3DVT 的新型多输入混合数据 3D 视觉 Transformer 方法,通过整合连续切片、多区域 3D 成像以及人口统计学和认知评估等多源数据,在结合 ADNI、AIBL 和 OASIS 数据集的实验中实现了 97.14% 的准确率,有效克服了现有阿尔茨海默病 MRI 诊断方法在三维上下文信息丢失、关注区域单一及数据源局限等方面的不足。

Juan A. Castro-Silva, Maria N. Moreno Garcia, Diego H. Peluffo-Ordoñez2026-03-03💻 cs

IdGlow: Dynamic Identity Modulation for Multi-Subject Generation

本文提出了 IdGlow,一种基于流匹配扩散模型的无掩码两阶段框架,通过任务自适应时间步调度、基于坏例的视觉语言模型提示合成以及细粒度组级直接偏好优化,有效解决了多主体生成中的稳定性 - 可塑性困境,在保持高保真身份特征的同时实现了自然和谐的场景融合与年龄变换。

Honghao Cai, Xiangyuan Wang, Yunhao Bai + 10 more2026-03-03🤖 cs.AI

Linking Modality Isolation in Heterogeneous Collaborative Perception

本文针对异构协同感知中因训练数据缺失共现样本而导致的模态隔离难题,提出了首个无需共现监督的高效对齐框架 CodeAlign,该方法通过跨模态特征 - 码本 - 特征(FCF)翻译机制实现模态对齐,在显著降低参数量与通信开销的同时,在 OPV2V 和 DAIR-V2X 数据集上取得了最先进的感知性能。

Changxing Liu, Zichen Chao, Siheng Chen2026-03-03💻 cs

Exploring Spatiotemporal Feature Propagation for Video-Level Compressive Spectral Reconstruction: Dataset, Model and Benchmark

本文针对现有光谱压缩成像方法在单帧重建不确定性及视频时序一致性方面的局限,构建了首个动态高光谱数据集 DynaSpec,提出了利用时空特征传播的 PG-SVRT 模型,并通过仿真与实物实验验证了其在重建质量、光谱保真度及时序一致性上的优越性能。

Lijing Cai, Zhan Shi, Chenglong Huang + 6 more2026-03-03💻 cs