cs.CV 篇论文 | Gist.Science

Uni-LVC: A Unified Method for Intra- and Inter-Mode Learned Video Compression

本文提出了 Uni-LVC，一种通过跨注意力适配模块和可靠性感知分类器，将帧间编码统一为基于参考帧条件化的帧内编码的单一模型，从而在低延迟和随机访问模式下同时实现高效且鲁棒的视频压缩。

Yichi Zhang, Ruoyu Yang, Fengqing Zhu2026-03-09💻 cs

Full Dynamic Range Sky-Modelling For Image Based Lighting

本文提出了名为 Icarus 的全天气天空模型，该模型能够学习全动态范围（FDR）物理捕获的户外图像曝光范围，通过条件生成支持用户控制太阳与云层位置及纹理，从而在基于图像的照明（IBL）中实现超越现有深度学习方法的高精度、高保真度且光照方向准确的自然天空模拟。

Ian J. Maquignaz2026-03-09🤖 cs.LG

Bridging Domains through Subspace-Aware Model Merging

该论文提出了一种名为 SCORE 的新方法，通过计算各模型主奇异向量的共享正交基并剪枝冲突分量，有效解决了多领域微调模型合并时的子空间冲突问题，从而显著提升了模型在未见领域上的泛化性能。

Levy Chaves, Chao Zhou, Rebekka Burkholz, Eduardo Valle, Sandra Avila2026-03-09🤖 cs.AI

Layer-wise Instance Binding for Regional and Occlusion Control in Text-to-Image Diffusion Transformers

该论文提出了一种名为 LayerBind 的无需训练且即插即用的方法，通过将区域生成建模为独立层并在早期去噪阶段进行实例绑定与语义增强，实现了基于文本到图像扩散 Transformer 的精确区域布局控制、遮挡顺序管理及灵活的后期编辑能力。

Ruidong Chen, Yancheng Bai, Xuanpu Zhang, Jianhao Zeng, Lanjun Wang, Dan Song, Lei Sun, Xiangxiang Chu, Anan Liu2026-03-09💻 cs

Visual Words Meet BM25: Sparse Auto-Encoder Visual Word Scoring for Image Retrieval

该论文提出了 BM25-V 方法，通过将稀疏自编码器生成的视觉词激活与 Okapi BM25 评分相结合，利用逆文档频率（IDF）加权机制在无需微调的情况下实现了高效、可解释且高精度的图像检索。

Donghoon Han, Eunhwan Park, Seunghyeon Seo2026-03-09🤖 cs.AI

Spectral Probing of Feature Upsamplers in 2D-to-3D Scene Reconstruction

该论文提出了一种包含六个指标的频谱诊断框架，揭示了在 2D 转 3D 重建中，特征上采样器的性能更取决于频谱结构的保持而非空间细节的增强，并发现结构频谱一致性是预测新视图合成质量的最强指标。

Ling Xiao, Yuliang Xiu, Yue Chen, Guoming Wang, Toshihiko Yamasaki2026-03-09💻 cs

EventGeM: Global-to-Local Feature Matching for Event-Based Visual Place Recognition

该论文提出了 EventGeM，一种基于事件相机的视觉定位方法，它通过融合预训练 ViT 提取的全局特征与 MaxViT 检测的局部特征，并结合深度估计进行重排序，在多个基准测试中实现了最先进的实时定位性能。

Adam D. Hines, Gokul B. Nair, Nicolás Marticorena, Michael Milford, Tobias Fischer2026-03-09💻 cs

Training-free Latent Inter-Frame Pruning with Attention Recovery

该论文提出了一种无需训练的 LIPAR 框架，通过利用视频潜在块的时间冗余性进行帧间剪枝，并引入注意力恢复机制以消除视觉伪影，从而在不牺牲生成质量的前提下显著提升了视频生成的推理速度。

Dennis Menn, Yuedong Yang, Bokun Wang, Xiwen Wei, Mustafa Munir, Feng Liang, Radu Marculescu, Chenfeng Xu, Diana Marculescu2026-03-09💻 cs

Margin and Consistency Supervision for Calibrated and Robust Vision Models

本文提出了名为 MaCS 的架构无关正则化框架，通过联合优化逻辑空间中的分类间隔与局部预测一致性，在无需额外数据或架构改动的情况下，显著提升了视觉模型的校准度、鲁棒性及泛化能力。

Salim Khazem2026-03-09🤖 cs.AI

Architectural Unification for Polarimetric Imaging Across Multiple Degradations

本文提出了一种统一的极化成像架构框架，通过单阶段联合图像与斯托克斯域处理，在无需针对每种退化类型重新设计网络结构的情况下，实现了去噪、去模糊和去马赛克等任务中物理一致且最先进的恢复性能。

Chu Zhou, Yufei Han, Junda Liao, Linrui Dai, Wangze Xu, Art Subpa-Asa, Heng Guo, Boxin Shi, Imari Sato2026-03-09💻 cs

Remote Sensing Image Classification Using Deep Ensemble Learning

该论文提出了一种结合卷积神经网络（CNN）与视觉 Transformer（ViT）的集成学习融合模型，通过训练四个独立模型并在预测阶段进行集成，有效克服了单一架构的局限性及冗余特征瓶颈，在 UC Merced、RSSCN7 和 MSRSI 等遥感图像数据集上取得了优于现有方法的分类精度。

Niful Islam, Md. Rayhan Ahmed, Nur Mohammad Fahad, Salekul Islam, A. K. M. Muzahidul Islam, Saddam Mukta, Swakkhar Shatabda2026-03-09🤖 cs.AI

Cog2Gen3D: Sculpturing 3D Semantic-Geometric Cognition for 3D Generation

Cog2Gen3D 提出了一种由 3D 认知引导的扩散框架，通过融合语义与绝对几何信息的认知特征嵌入、3D 潜在认知图及认知引导的潜在扩散机制，解决了现有方法在 3D 生成中缺乏空间几何约束和尺度一致性的问题，显著提升了生成结果的语义保真度与几何合理性。

Haonan Wang, Hanyu Zhou, Haoyue Liu, Tao Gu, Luxin Yan2026-03-09💻 cs

VS3R: Robust Full-frame Video Stabilization via Deep 3D Reconstruction

VS3R 提出了一种结合前馈 3D 重建与生成式视频扩散的框架，通过联合估计相机参数、深度和掩码，并引入混合稳定渲染与双流扩散模型，实现了在极端运动下兼具高鲁棒性与全帧一致性的视频稳定效果。

Muhua Zhu, Xinhao Jin, Yu Zhang, Yifei Xue, Tie Ji, Yizhen Lao2026-03-09💻 cs

Evolving Medical Imaging Agents via Experience-driven Self-skill Discovery

本文提出了 MACRO，一种通过从验证执行轨迹中自主发现并合成可复用复合工具，从而将静态工具组合转变为经验驱动式自我演进的医疗影像智能体，显著提升了多步骤任务编排的准确性与跨域泛化能力。

Lin Fan, Pengyu Dai, Zhipeng Deng, Haolin Wang, Xun Gong, Yefeng Zheng, Yafei Ou2026-03-09🤖 cs.AI

TumorChain: Interleaved Multimodal Chain-of-Thought Reasoning for Traceable Clinical Tumor Analysis

本文提出了 TumorChain 框架，通过构建包含 150 万条思维链标注的大规模多模态数据集 TumorCoT，并采用交错式多模态推理机制，实现了从医学影像发现到病理预测的可追溯、高准确率的临床肿瘤分析。

Sijing Li, Zhongwei Qiu, Jiang Liu, Wenqiao Zhang, Tianwei Lin, Yihan Xie, Jianxiang An, Boxiang Yun, Chenglin Yang, Jun Xiao, Guangyu Guo, Jiawen Yao, Wei Liu, Yuan Gao, Ke Yan, Weiwei Cao, Zhilin Zheng, Tony C. W. Mok, Kai Cao, Yu Shi, Jiuyu Zhang, Jian Zhou, Beng Chin Ooi, Yingda Xia, Ling Zhang2026-03-09💻 cs

cs.CV