InnoAds-Composer: Efficient Condition Composition for E-Commerce Poster Generation

本文提出了 InnoAds-Composer,一种针对电商海报生成的单阶段框架,通过动态路由机制实现高效的主体、文字和风格三重条件控制,并配合文本特征增强模块与首个联合数据集,显著提升了生成质量与文字准确性,同时保持了较低的推理延迟。

Yuxin Qin, Ke Cao, Haowei Liu, Ao Ma, Fengheng Li, Honghe Zhu, Zheng Zhang, Run Ling, Wei Feng, Xuanhua He, Zhanjie Zhang, Zhen Guo, Haoyi Bian, Jingjing Lv, Junjie Shen, Ching Law2026-03-09💻 cs

Mitigating Bias in Concept Bottleneck Models for Fair and Interpretable Image Classification

该论文针对概念瓶颈模型(CBM)在图像分类中存在的概念信息泄露及性别偏见问题,提出了包括 Top-k 概念过滤、移除偏见概念和对抗性去偏在内的三种缓解技术,显著提升了模型在公平性与性能之间的权衡,推动了可解释且公平图像分类的发展。

Schrasing Tong, Antoine Salaun, Vincent Yuan, Annabel Adeyeri, Lalana Kagal2026-03-09🤖 cs.LG

CollabOD: Collaborative Multi-Backbone with Cross-scale Vision for UAV Small Object Detection

该论文提出了一种名为 CollabOD 的轻量级协同检测框架,通过结构细节保持、跨路径特征对齐及定位感知轻量化设计,有效解决了无人机图像中小目标检测中因尺度变化、细节退化及资源受限导致的定位不稳定和鲁棒性不足问题。

Xuecheng Bai, Yuxiang Wang, Chuanzhi Xu, Boyu Hu, Kang Han, Ruijie Pan, Xiaowei Niu, Xiaotian Guan, Liqiang Fu, Pengfei Ye2026-03-09💻 cs

CORE-Seg: Reasoning-Driven Segmentation for Complex Lesions via Reinforcement Learning

该论文提出了首个面向复杂病灶推理分割的 Chain-of-Thought 基准 ComLesion-14K,并设计了结合语义引导提示适配器与自适应双粒度奖励机制的 CORE-Seg 框架,通过从监督微调(SFT)到 GRPO 的渐进式训练策略,显著提升了复杂病灶分割的精度与逻辑可解释性。

Yuxin Xie, Yuming Chen, Yishan Yang, Yi Zhou, Tao Zhou, Zhen Zhao, Jiacheng Liu, Huazhu Fu2026-03-09🤖 cs.AI

Beyond Static Frames: Temporal Aggregate-and-Restore Vision Transformer for Human Pose Estimation

本文提出了 TAR-ViTPose,一种专为视频 2D 人体姿态估计设计的时序聚合与恢复视觉 Transformer,通过引入关节中心时序聚合(JTA)和全局恢复注意力(GRA)机制,有效利用帧间时序信息以解决静态模型在遮挡和运动模糊等场景下的不稳定性问题,从而在 PoseTrack2017 基准上显著提升了精度并实现了更高的实时运行帧率。

Hongwei Fang, Jiahang Cai, Xun Wang, Wenwu Yang2026-03-09💻 cs

LucidNFT: LR-Anchored Multi-Reward Preference Optimization for Generative Real-World Super-Resolution

LucidNFT 提出了一种基于流匹配的生成式真实世界超分辨率多奖励强化学习框架,通过引入抗退化的语义一致性评估器(LucidConsistency)、解耦的优势归一化策略以及大规模真实退化数据集(LucidLR),有效解决了现有方法中语义幻觉、多奖励优化导致的优势坍缩及退化覆盖不足等关键问题,实现了感知质量与低分辨率锚定忠实度之间的更优平衡。

Song Fei, Tian Ye, Sixiang Chen, Zhaohu Xing, Jianyu Lai, Lei Zhu2026-03-09💻 cs