Real5-OmniDocBench: A Full-Scale Physical Reconstruction Benchmark for Robust Document Parsing in the Wild

本文提出了 Real5-OmniDocBench,这是首个对 OmniDocBench v1.5 进行全规模物理重建的基准测试,通过覆盖扫描、形变、屏幕拍摄、光照和倾斜五种真实场景,首次实现了对文档解析性能下降因素的精确归因,揭示了当前视觉语言模型在真实物理世界中的显著差距。

Changda Zhou, Ziyue Gao, Xueqing Wang + 4 more2026-03-05💻 cs

SPRINT: Semi-supervised Prototypical Representation for Few-Shot Class-Incremental Tabular Learning

本文提出了 SPRINT,这是首个专为表格数据设计的半监督原型表示少样本类增量学习框架,它利用置信度伪标签和低成本存储策略有效解决了在有限标注数据下持续学习新类别且不遗忘旧知识的问题,并在多个跨领域基准测试中取得了超越现有最先进方法的性能。

Umid Suleymanov, Murat Kantarcioglu, Kevin S Chan + 6 more2026-03-05🤖 cs.AI

Pointer-CAD: Unifying B-Rep and Command Sequences via Pointer-based Edges & Faces Selection

本文提出了 Pointer-CAD 框架,通过引入基于指针的实体选择机制将 B-Rep 几何信息与命令序列相结合,有效解决了传统 LLM 生成 CAD 模型时无法进行复杂编辑及因离散化导致拓扑错误的问题,并构建了包含 57.5 万个模型的数据集以验证其在生成复杂几何结构方面的显著优势。

Dacheng Qi, Chenyu Wang, Jingwei Xu + 6 more2026-03-05💬 cs.CL