Layer-wise Instance Binding for Regional and Occlusion Control in Text-to-Image Diffusion Transformers

该论文提出了一种名为 LayerBind 的无需训练且即插即用的方法,通过将区域生成建模为独立层并在早期去噪阶段进行实例绑定与语义增强,实现了基于文本到图像扩散 Transformer 的精确区域布局控制、遮挡顺序管理及灵活的后期编辑能力。

Ruidong Chen, Yancheng Bai, Xuanpu Zhang, Jianhao Zeng, Lanjun Wang, Dan Song, Lei Sun, Xiangxiang Chu, Anan Liu2026-03-09💻 cs

Remote Sensing Image Classification Using Deep Ensemble Learning

该论文提出了一种结合卷积神经网络(CNN)与视觉 Transformer(ViT)的集成学习融合模型,通过训练四个独立模型并在预测阶段进行集成,有效克服了单一架构的局限性及冗余特征瓶颈,在 UC Merced、RSSCN7 和 MSRSI 等遥感图像数据集上取得了优于现有方法的分类精度。

Niful Islam, Md. Rayhan Ahmed, Nur Mohammad Fahad, Salekul Islam, A. K. M. Muzahidul Islam, Saddam Mukta, Swakkhar Shatabda2026-03-09🤖 cs.AI

TumorChain: Interleaved Multimodal Chain-of-Thought Reasoning for Traceable Clinical Tumor Analysis

本文提出了 TumorChain 框架,通过构建包含 150 万条思维链标注的大规模多模态数据集 TumorCoT,并采用交错式多模态推理机制,实现了从医学影像发现到病理预测的可追溯、高准确率的临床肿瘤分析。

Sijing Li, Zhongwei Qiu, Jiang Liu, Wenqiao Zhang, Tianwei Lin, Yihan Xie, Jianxiang An, Boxiang Yun, Chenglin Yang, Jun Xiao, Guangyu Guo, Jiawen Yao, Wei Liu, Yuan Gao, Ke Yan, Weiwei Cao, Zhilin Zheng, Tony C. W. Mok, Kai Cao, Yu Shi, Jiuyu Zhang, Jian Zhou, Beng Chin Ooi, Yingda Xia, Ling Zhang2026-03-09💻 cs

Shifting Adaptation from Weight Space to Memory Space: A Memory-Augmented Agent for Medical Image Segmentation

该论文提出了一种名为 MemSeg-Agent 的记忆增强智能体,通过将医学图像分割的适应过程从权重空间转移到记忆空间,利用静态、少样本和测试时工作记忆在无需微调的情况下实现了高效的联邦学习、少样本适应及跨域鲁棒性。

Bowen Chen, Qiaohui Gao, Shaowen Wan, Shanhui Sun, Wei Liu, Xiang Li, Tianming Liu, Lin Zhao2026-03-09💻 cs