Scalable and Performant Data Loading
本文介绍了 SPDL,一个开源且框架无关的库,旨在通过完全释放 Python 全局解释器锁(GIL)来并行化数据预处理,从而显著加速 GPU 数据加载,在基准测试中相比 PyTorch DataLoader 提升了 74% 的迭代速度并降低了资源消耗,且在 Free-Threaded Python 环境下性能进一步提升了 33%。
8114 篇论文
本文介绍了 SPDL,一个开源且框架无关的库,旨在通过完全释放 Python 全局解释器锁(GIL)来并行化数据预处理,从而显著加速 GPU 数据加载,在基准测试中相比 PyTorch DataLoader 提升了 74% 的迭代速度并降低了资源消耗,且在 Free-Threaded Python 环境下性能进一步提升了 33%。
该论文提出了名为 iTuP 的逆工具使用规划框架及其核心网络 SDG-Net,通过基于刚体力学推导任务轨迹中的预测交互力矩并优化抓取选择,有效解决了传统视觉 - 语言系统在动态工具操作中因忽略惯性冲击和杠杆效应而导致的滑移与失稳问题,显著提升了真实世界中的任务成功率。
该论文针对现有单源遥感目标检测在复杂环境下的局限性,提出了包含近百万标注实例的多分辨率、多极化、多场景、多源光学-SAR 融合数据集 M4-SAR,并配套开发了统一评测工具包及新型端到端融合检测框架 E2E-OSDet,显著提升了复杂场景下的检测精度。
本文提出了 MARRS 框架,通过结合独立编码身体与手部单元的 UD-VAE、基于随机掩码的 Action-Conditioned Fusion 以及促进单元间交互的 Adaptive Unit Modulation,利用连续表示和扩散模型实现了高质量的细粒度人类动作反应合成。
本文提出了基于扩散变换器(DiT)的 EasyText 框架,通过字符定位编码与位置编码插值技术,结合大规模多语言合成数据集,实现了高质量、可控且布局感知的多语言文本渲染。
该论文通过基于 30,000 多个真实漏洞修复补丁的实证研究,系统评估了预训练语言模型(PLMs)和大语言模型(LLMs)在七种编程语言及函数与行双粒度下的漏洞检测能力,发现经过指令微调和少样本提示优化的 GPT-4o 在检测多语言及高危漏洞方面显著优于其他模型。
本文提出了名为 SpikeSMOKE 的架构,通过引入受生物突触过滤机制启发的跨尺度门控编码(CSGC)和轻量级残差块,成功将低功耗的脉冲神经网络应用于单目 3D 目标检测,在 KITTI 等数据集上显著提升了检测精度并大幅降低了能耗与计算量。
本文提出了故障容错全支配集问题的首个 近似算法,并针对加权部分正影响支配集问题的简单、全及连通变体证明了首个对数近似结果,其中连通情形的证明通过将有理函数扩展至分数值函数框架而实现。
该论文发布了一个涵盖 2013 至 2022 年十年间奥地利《标准报》(DerStandard)平台的大规模纵向数据集,包含超过 7500 万条评论、4 亿多张投票及丰富的元数据,通过提供匿名化标识符和预计算的向量表示而非原始文本,在严格保护用户隐私的同时,为德语在线话语的动态、网络结构及语义分析研究提供了宝贵资源。
本文介绍了 PyPitfall 研究,通过对 378,573 个 PyPI 包的依赖结构进行量化分析,揭示了 Python 软件供应链中广泛存在且易被忽视的漏洞依赖问题,旨在提升业界对 Python 供应链安全的关注。
本文提出了名为 FieldLVLM 的新框架,通过结合物理特征提取的领域感知语言生成策略与数据压缩的多模态模型微调,显著提升了大型视觉语言模型对流场等科学领域数据的理解能力。
本文提出并分析了一种用于模拟斯托克斯流与 Biot-Kirchhoff 多孔弹性板耦合的 3D-2D 模型,通过证明其连续与离散形式的适定性及最优收敛性,展示了该方法在硅纳米孔膜免疫隔离封装模拟中的应用。
本文针对具有不确定配合类型和配合量的批量化精密装配任务,提出了一种基于力 - 视觉融合控制器驱动的多任务强化学习与多教师策略蒸馏相结合的方法,成功构建并验证了能够适应不同配合状态、兼具高训练效率与优异力顺应性的鲁棒机器人装配控制策略。
该论文提出了一种基于图计算框架的确定性多项式时间算法,通过利用边重叠特性及局部不可行性修剪机制,在不显式枚举证书的情况下将 NP 问题的验证复杂度降至多项式级别,从而给出了 P=NP 的构造性证明。
本文提出了YOPO,一种单阶段、基于查询的极简检测Transformer框架,仅需单目RGB图像和类别级标签即可实现端到端的9自由度多物体姿态估计,并在多个基准测试中刷新了仅用RGB数据的性能纪录。
本文提出了名为 Adaptive Tamaraw 的自适应网站指纹防御框架,该框架通过聚类分析将流量划分为 (k,l)-多样性匿名集并动态调整填充参数,在保留信息论安全保证的同时,实现了隐私保护与通信开销之间的灵活权衡。
本文提出了结合大语言模型与基于搜索的软件测试技术的 BLAST 工具,用于从问题 - 补丁对中自动生成复现问题的测试用例,并在基准测试和 GitHub 实际部署中验证了其优于现有技术的性能及实用价值。
CoRe-GS 提出了一种面向任务驱动的粗到精高斯溅射框架,通过仅对感兴趣区域进行选择性优化并引入颜色过滤机制去除异常点,在显著降低计算成本的同时提升了特定场景点的重建质量与分割效率,从而满足机器人实时操作需求。
本文通过对 GitHub 上数百万静态类型语言仓库的大规模实证研究,揭示了现实世界中浮点数算术的使用特征,验证了现有基准测试的部分代表性并指出了其不足,同时发布了一个包含 1000 万个真实浮点函数的数据集以推动相关自动推理技术的发展。
本文提出了名为 AwesomeDE 的框架,利用大语言模型作为元优化器,通过标准化的提示设计()自动生成并进化无人类干预的约束进化算法更新规则,实验表明该方法在计算效率、解的精度及跨领域泛化能力上均优于现有方法。