Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach

该论文针对现有局部 AI 生成图像检测数据集缺乏场景级编辑覆盖的局限,提出了包含 15 万张图像的大规模场景感知数据集 BR-Gen,并设计了基于噪声指纹引导的特征放大机制 NFA-ViT,通过增强异常特征与正常特征的交互显著提升了局部伪造检测的鲁棒性与泛化能力。

Lvpan Cai, Haowei Wang, Jiayi Ji, Yanshu Zhoumen, Shen Chen, Taiping Yao, Xiaoshuai SunWed, 11 Ma💻 cs

Scalable and Performant Data Loading

本文介绍了 SPDL,一个开源且框架无关的库,旨在通过完全释放 Python 全局解释器锁(GIL)来并行化数据预处理,从而显著加速 GPU 数据加载,在基准测试中相比 PyTorch DataLoader 提升了 74% 的迭代速度并降低了资源消耗,且在 Free-Threaded Python 环境下性能进一步提升了 33%。

Moto Hira, Christian Puhrsch, Valentin Andrei, Roman Malinovskyy, Gael Le Lan, Abhinandan Krishnan, Joseph Cummings, Victor Bourgin, Olga Gerasimova, Miguel Martin, Gokul Gunasekaran, Yuta Inoue, Alex J Turner, Raghuraman KrishnamoorthiWed, 11 Ma💻 cs

M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for optical-SAR Object Detection

该论文针对现有单源遥感目标检测在复杂环境下的局限性,提出了包含近百万标注实例的多分辨率、多极化、多场景、多源光学-SAR 融合数据集 M4-SAR,并配套开发了统一评测工具包及新型端到端融合检测框架 E2E-OSDet,显著提升了复杂场景下的检测精度。

Chao Wang, Wei Lu, Xiang Li, Jian Yang, Lei LuoWed, 11 Ma💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

该论文通过基于 30,000 多个真实漏洞修复补丁的实证研究,系统评估了预训练语言模型(PLMs)和大语言模型(LLMs)在七种编程语言及函数与行双粒度下的漏洞检测能力,发现经过指令微调和少样本提示优化的 GPT-4o 在检测多语言及高危漏洞方面显著优于其他模型。

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka KameiWed, 11 Ma💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

本文提出了名为 SpikeSMOKE 的架构,通过引入受生物突触过滤机制启发的跨尺度门控编码(CSGC)和轻量级残差块,成功将低功耗的脉冲神经网络应用于单目 3D 目标检测,在 KITTI 等数据集上显著提升了检测精度并大幅降低了能耗与计算量。

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen HuangWed, 11 Ma💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

该论文发布了一个涵盖 2013 至 2022 年十年间奥地利《标准报》(DerStandard)平台的大规模纵向数据集,包含超过 7500 万条评论、4 亿多张投票及丰富的元数据,通过提供匿名化标识符和预计算的向量表示而非原始文本,在严格保护用户隐私的同时,为德语在线话语的动态、网络结构及语义分析研究提供了宝贵资源。

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max PellertWed, 11 Ma💻 cs

CoRe-GS: Coarse-to-Refined Gaussian Splatting with Semantic Object Focus

CoRe-GS 提出了一种面向任务驱动的粗到精高斯溅射框架,通过仅对感兴趣区域进行选择性优化并引入颜色过滤机制去除异常点,在显著降低计算成本的同时提升了特定场景点的重建质量与分割效率,从而满足机器人实时操作需求。

Hannah Schieber, Dominik Frischmann, Victor Schaack, Simon Boche, Angela Schoellig, Stefan Leutenegger, Daniel RothWed, 11 Ma💻 cs

VocSegMRI: Multimodal Learning for Precise Vocal Tract Segmentation in Real-time MRI

本文提出了 VocSegMRI 框架,通过融合视频、音频和音位信息并利用交叉注意力机制与对比学习,显著提升了实时磁共振成像(rtMRI)中声道分割的精度与鲁棒性,在 USC-75 数据集上取得了优于现有方法的性能。

Daiqi Liu, Tomás Arias-Vergara, Johannes Enk, Fangxu Xing, Maureen Stone, Jerry L. Prince, Jana Hutter, Andreas Maier, Jonghye Woo, Paula Andrea Pérez-ToroWed, 11 Ma💻 cs

Multi-Quadruped Cooperative Object Transport: Learning Decentralized Pinch-Lift-Move

该论文提出了一种基于分层策略和星座奖励机制的去中心化多足机器人协作搬运方法,使 N 台四足机器人在无通信、无刚性连接且仅靠物理接触的情况下,能够协同完成对不可抓取物体的夹取、提升与移动任务,并实现了从 2 到 10 台机器人的任意规模扩展及仿真到现实的迁移。

Bikram Pandit, Aayam Kumar Shrestha, Alan FernWed, 11 Ma💻 cs