The MVTec AD 2 Dataset: Advanced Scenarios for Unsupervised Anomaly Detection

本文针对现有异常检测基准性能饱和的问题,推出了包含 8000 多张高分辨率图像、涵盖透明物体、复杂光照及微小缺陷等更具挑战性工业场景的 MVTec AD 2 数据集,并通过评估显示现有最先进模型在该数据集上的平均 AU-PRO 表现仍低于 60%,从而为推动该领域发展提供了新的基准。

Lars Heckler-Kram, Jan-Hendrik Neudeck, Ulla Scheler + 2 more2026-03-11💻 cs

Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach

该论文针对现有局部 AI 生成图像检测数据集缺乏场景级编辑覆盖的局限,提出了包含 15 万张图像的大规模场景感知数据集 BR-Gen,并设计了基于噪声指纹引导的特征放大机制 NFA-ViT,通过增强异常特征与正常特征的交互显著提升了局部伪造检测的鲁棒性与泛化能力。

Lvpan Cai, Haowei Wang, Jiayi Ji, Yanshu Zhoumen, Shen Chen, Taiping Yao, Xiaoshuai Sun2026-03-11💻 cs

Scalable and Performant Data Loading

本文介绍了 SPDL,一个开源且框架无关的库,旨在通过完全释放 Python 全局解释器锁(GIL)来并行化数据预处理,从而显著加速 GPU 数据加载,在基准测试中相比 PyTorch DataLoader 提升了 74% 的迭代速度并降低了资源消耗,且在 Free-Threaded Python 环境下性能进一步提升了 33%。

Moto Hira, Christian Puhrsch, Valentin Andrei, Roman Malinovskyy, Gael Le Lan, Abhinandan Krishnan, Joseph Cummings, Victor Bourgin, Olga Gerasimova, Miguel Martin, Gokul Gunasekaran, Yuta Inoue, Alex J Turner, Raghuraman Krishnamoorthi2026-03-11💻 cs

M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for optical-SAR Object Detection

该论文针对现有单源遥感目标检测在复杂环境下的局限性,提出了包含近百万标注实例的多分辨率、多极化、多场景、多源光学-SAR 融合数据集 M4-SAR,并配套开发了统一评测工具包及新型端到端融合检测框架 E2E-OSDet,显著提升了复杂场景下的检测精度。

Chao Wang, Wei Lu, Xiang Li, Jian Yang, Lei Luo2026-03-11💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

该论文通过基于 30,000 多个真实漏洞修复补丁的实证研究,系统评估了预训练语言模型(PLMs)和大语言模型(LLMs)在七种编程语言及函数与行双粒度下的漏洞检测能力,发现经过指令微调和少样本提示优化的 GPT-4o 在检测多语言及高危漏洞方面显著优于其他模型。

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka Kamei2026-03-11💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

本文提出了名为 SpikeSMOKE 的架构,通过引入受生物突触过滤机制启发的跨尺度门控编码(CSGC)和轻量级残差块,成功将低功耗的脉冲神经网络应用于单目 3D 目标检测,在 KITTI 等数据集上显著提升了检测精度并大幅降低了能耗与计算量。

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen Huang2026-03-11💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

该论文发布了一个涵盖 2013 至 2022 年十年间奥地利《标准报》(DerStandard)平台的大规模纵向数据集,包含超过 7500 万条评论、4 亿多张投票及丰富的元数据,通过提供匿名化标识符和预计算的向量表示而非原始文本,在严格保护用户隐私的同时,为德语在线话语的动态、网络结构及语义分析研究提供了宝贵资源。

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max Pellert2026-03-11💻 cs

A robust and compliant robotic assembly control strategy for batch precision assembly task with uncertain fit types and fit amounts

本文针对具有不确定配合类型和配合量的批量化精密装配任务,提出了一种基于力 - 视觉融合控制器驱动的多任务强化学习与多教师策略蒸馏相结合的方法,成功构建并验证了能够适应不同配合状态、兼具高训练效率与优异力顺应性的鲁棒机器人装配控制策略。

Bin Wang, Jiwen Zhang, Song Wang + 1 more2026-03-11💻 cs