Beyond Heuristic Prompting: A Concept-Guided Bayesian Framework for Zero-Shot Image Recognition

本文提出了一种概念引导的贝叶斯框架,通过结合大语言模型生成的多样化判别性概念、行列式点过程以及自适应软截断似然机制,有效解决了现有零样本图像识别方法中提示工程依赖启发式设计及泛化能力不足的问题,从而显著提升了分类性能。

Hui Liu, Kecheng Chen, Jialiang Wang, Xianming Liu, Wenya Wang, Haoliang Li2026-03-10💻 cs

RLPR: Radar-to-LiDAR Place Recognition via Two-Stage Asymmetric Cross-Modal Alignment for Autonomous Driving

本文提出了 RLPR 框架,通过双流网络提取跨模态通用结构特征,并创新性地采用两阶段非对称跨模态对齐策略,有效解决了雷达与 LiDAR 间特征差异大及配对数据稀缺的难题,实现了在多种雷达类型和恶劣天气下的高精度零样本泛化定位。

Zhangshuo Qi, Jingyi Xu, Luqi Cheng, Shichen Wen, Guangming Xiong2026-03-10💻 cs

IMSE: Intrinsic Mixture of Spectral Experts Fine-tuning for Test-Time Adaptation

本文提出了 IMSE 方法,通过仅微调预训练视觉 Transformer 线性层的奇异值(即谱专家)并引入基于专家输入对齐的多样性最大化损失以解决特征坍塌问题,结合域感知谱码检索机制,在显著减少可训练参数量的同时实现了测试时适应及持续测试时适应任务中的最先进性能。

Sunghyun Baek (Korea Advanced Institute of Science and Technology), Jaemyung Yu (Korea Advanced Institute of Science and Technology), Seunghee Koh (Korea Advanced Institute of Science and Technology), Minsu Kim (LG Energy Solution), Hyeonseong Jeon (LG Energy Solution), Junmo Kim (Korea Advanced Institute of Science and Technology)2026-03-10💻 cs

Text to Automata Diagrams: Comparing TikZ Code Generation with Direct Image Synthesis

该研究通过对比分析表明,虽然直接利用视觉语言模型从学生手绘自动机图生成描述存在错误,但经人工修正后的描述能显著提升大语言模型生成准确 TikZ 代码的质量,从而为计算机科学教育中的自动评分和反馈提供了可行路径。

Ethan Young, Zichun Wang, Aiden Taylor, Chance Jewell, Julian Myers, Satya Sri Rajiteswari Nimmagadda, Anthony White, Aniruddha Maiti, Ananya Jana2026-03-10💻 cs

L3L^3:Scene-agnostic Visual Localization in the Wild

本文提出了一种名为L3L^3的无地图视觉定位框架,该框架利用前馈3D重建网络的在线推理能力,通过直接对RGB图像进行在线3D重建及两阶段尺度恢复与姿态优化,在无需离线预处理或存储场景表征的情况下,实现了与最先进方法相当的高精度定位,并在稀疏场景下展现出显著更优的鲁棒性。

Yu Zhang, Muhua Zhu, Yifei Xue, Tie Ji, Yizhen Lao2026-03-10💻 cs

Extend Your Horizon: A Device-Agnostic Surgical Tool Tracking Framework with Multi-View Optimization for Augmented Reality

该论文提出了一种基于多视图优化的设备无关手术工具跟踪框架,通过融合多种传感模态并构建动态场景图,有效解决了增强现实手术导航中因遮挡导致的视线受阻问题,显著提升了跟踪的鲁棒性与可视化一致性。

Jiaming Zhang, Mingxu Liu, Hongchao Shu, Ruixing Liang, Yihao Liu, Ojas Taskar, Amir Kheradmand, Mehran Armand, Alejandro Martin-Gomez2026-03-10💻 cs

On the Feasibility and Opportunity of Autoregressive 3D Object Detection

本文提出了 AutoReg3D,一种将 LiDAR 3D 目标检测重构为序列生成任务的自回归检测器,它通过近至远的生成顺序摒弃了传统锚框和非极大值抑制(NMS),在保持竞争力的同时为引入大语言模型等现代序列建模技术开辟了新的路径。

Zanming Huang, Jinsu Yoo, Sooyoung Jeon, Zhenzhen Liu, Mark Campbell, Kilian Q Weinberger, Bharath Hariharan, Wei-Lun Chao, Katie Z Luo2026-03-10💻 cs