Small Drafts, Big Verdict: Information-Intensive Visual Reasoning via Speculation

本文提出了无需训练的“推测性裁决”(Speculative Verdict)框架,通过结合多个轻量级草稿专家生成多样化推理路径并由强模型进行裁决与共识筛选,有效解决了大型视觉语言模型在处理信息密集型图像时的定位困难与多跳推理挑战,在显著提升准确率的同时实现了计算成本的最优化。

Yuhan Liu, Lianhui Qin, Shengjie Wang2026-03-02💬 cs.CL