Small Drafts, Big Verdict: Information-Intensive Visual Reasoning via Speculation

本文提出了无需训练的“推测性裁决”(Speculative Verdict)框架,通过结合多个轻量级草稿专家生成多样化推理路径并由强模型进行裁决与共识筛选,有效解决了大型视觉语言模型在处理信息密集型图像时的定位困难与多跳推理挑战,在显著提升准确率的同时实现了计算成本的最优化。

Yuhan Liu, Lianhui Qin, Shengjie Wang2026-03-02💬 cs.CL

General vs Domain-Specific CNNs: Understanding Pretraining Effects on Brain MRI Tumor Classification

该研究通过对比分析发现,在脑 MRI 肿瘤分类任务中,基于大规模通用数据集预训练的 ConvNeXt-Tiny 模型(准确率 93%)的表现显著优于基于医学专用数据集预训练的 RadImageNet DenseNet121 模型(准确率 68%),表明在数据受限场景下,现代通用架构的迁移学习潜力可能优于领域特定预训练模型。

Helia Abedini, Saba Rahimi, Reza Vaziri2026-03-02🤖 cs.AI

ColaVLA: Leveraging Cognitive Latent Reasoning for Hierarchical Parallel Trajectory Planning in Autonomous Driving

本文提出了 ColaVLA 框架,通过构建认知潜在推理器将文本推理压缩至统一潜在空间,并结合分层并行轨迹解码器,在保留大语言模型泛化与可解释性优势的同时,有效解决了现有视觉 - 语言规划器在连续控制匹配、推理延迟及实时性方面的挑战,在 nuScenes 基准测试中实现了最先进的开环与闭环性能。

Qihang Peng, Xuesong Chen, Chenye Yang + 2 more2026-03-02💻 cs