Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs

本文提出了名为 CogAlign 的新框架,通过构建分层临床认知数据集进行监督微调以对齐专家诊断逻辑,并引入基于反事实推理的强化学习策略以消除视觉偏差、确保诊断基于因果病灶特征,从而在胃肠内镜诊断中实现了最先进的性能。

Huan Zheng, Yucheng Zhou, Tianyi Yan, Dubing Chen, Hongbo Lu, Wenlong Liao, Tao He, Pai Peng, Jianbing Shen2026-03-24💬 cs.CL

Premier: Personalized Preference Modulation with Learnable User Embedding in Text-to-Image Generation

本文提出了 Premier 框架,通过引入可学习的用户偏好嵌入和偏好适配器,结合分散损失以增强个体区分度,并利用现有嵌入的线性组合实现少样本泛化,从而显著提升了文本到图像生成中的个性化偏好对齐与风格一致性。

Zihao Wang, Yuxiang Wei, Xinpeng Zhou, Tianyu Zhang, Tao Liang, Yalong Bai, Hongzhi Zhang, Wangmeng Zuo2026-03-24💻 cs

Mamba Learns in Context: Structure-Aware Domain Generalization for Multi-Task Point Cloud Understanding

本文提出了一种名为 SADG 的基于 Mamba 的上下文学习框架,通过结构感知序列化、分层域建模及轻量级谱图对齐技术,有效解决了点云多任务域泛化中的结构漂移问题,并发布了 MP3DObject 数据集以验证其在重建、去噪和配准等任务中的优越性能。

Jincen Jiang, Qianyu Zhou, Yuhang Li, Kui Su, Meili Wang, Jian Chang, Jian Jun Zhang, Xuequan Lu2026-03-24💻 cs