cs 篇论文 | Gist.Science

Scalable and Performant Data Loading

本文介绍了 SPDL，一个开源且框架无关的库，旨在通过完全释放 Python 全局解释器锁（GIL）来并行化数据预处理，从而显著加速 GPU 数据加载，在基准测试中相比 PyTorch DataLoader 提升了 74% 的迭代速度并降低了资源消耗，且在 Free-Threaded Python 环境下性能进一步提升了 33%。

Moto Hira, Christian Puhrsch, Valentin Andrei, Roman Malinovskyy, Gael Le Lan, Abhinandan Krishnan, Joseph Cummings, Victor Bourgin, Olga Gerasimova, Miguel Martin, Gokul Gunasekaran, Yuta Inoue, Alex J Turner, Raghuraman Krishnamoorthi2026-03-11💻 cs

Physics-Conditioned Grasping for Stable Tool Use

该论文提出了名为 iTuP 的逆工具使用规划框架及其核心网络 SDG-Net，通过基于刚体力学推导任务轨迹中的预测交互力矩并优化抓取选择，有效解决了传统视觉 - 语言系统在动态工具操作中因忽略惯性冲击和杠杆效应而导致的滑移与失稳问题，显著提升了真实世界中的任务成功率。

Noah Trupin, Zixing Wang, Ahmed H. Qureshi2026-03-11💻 cs

M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for optical-SAR Object Detection

该论文针对现有单源遥感目标检测在复杂环境下的局限性，提出了包含近百万标注实例的多分辨率、多极化、多场景、多源光学-SAR 融合数据集 M4-SAR，并配套开发了统一评测工具包及新型端到端融合检测框架 E2E-OSDet，显著提升了复杂场景下的检测精度。

Chao Wang, Wei Lu, Xiang Li, Jian Yang, Lei Luo2026-03-11💻 cs

MARRS: Masked Autoregressive Unit-based Reaction Synthesis

本文提出了 MARRS 框架，通过结合独立编码身体与手部单元的 UD-VAE、基于随机掩码的 Action-Conditioned Fusion 以及促进单元间交互的 Adaptive Unit Modulation，利用连续表示和扩散模型实现了高质量的细粒度人类动作反应合成。

Yabiao Wang, Shuo Wang, Jiangning Zhang, Jiafu Wu, Qingdong He, Yong Liu2026-03-11💻 cs

EasyText: Controllable Diffusion Transformer for Multilingual Text Rendering

本文提出了基于扩散变换器（DiT）的 EasyText 框架，通过字符定位编码与位置编码插值技术，结合大规模多语言合成数据集，实现了高质量、可控且布局感知的多语言文本渲染。

Runnan Lu, Yuxuan Zhang, Jiaming Liu, Haofan Wang, Yiren Song2026-03-11💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

该论文通过基于 30,000 多个真实漏洞修复补丁的实证研究，系统评估了预训练语言模型（PLMs）和大语言模型（LLMs）在七种编程语言及函数与行双粒度下的漏洞检测能力，发现经过指令微调和少样本提示优化的 GPT-4o 在检测多语言及高危漏洞方面显著优于其他模型。

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka Kamei2026-03-11💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

本文提出了名为 SpikeSMOKE 的架构，通过引入受生物突触过滤机制启发的跨尺度门控编码（CSGC）和轻量级残差块，成功将低功耗的脉冲神经网络应用于单目 3D 目标检测，在 KITTI 等数据集上显著提升了检测精度并大幅降低了能耗与计算量。

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen Huang2026-03-11💻 cs

Approximations for Fault-Tolerant Total and Partial Positive Influence Domination

本文提出了故障容错全支配集问题的首个 $1 + \ln(\Delta + m - 1)$ 近似算法，并针对加权部分正影响支配集问题的简单、全及连通变体证明了首个对数近似结果，其中连通情形的证明通过将有理函数扩展至分数值函数框架而实现。

Ioannis Lamprou, Ioannis Sigalas, Ioannis Vaxevanakis + 1 more2026-03-11💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

该论文发布了一个涵盖 2013 至 2022 年十年间奥地利《标准报》（DerStandard）平台的大规模纵向数据集，包含超过 7500 万条评论、4 亿多张投票及丰富的元数据，通过提供匿名化标识符和预计算的向量表示而非原始文本，在严格保护用户隐私的同时，为德语在线话语的动态、网络结构及语义分析研究提供了宝贵资源。

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max Pellert2026-03-11💻 cs

PyPitfall: Dependency Chaos and Software Supply Chain Vulnerabilities in Python

本文介绍了 PyPitfall 研究，通过对 378,573 个 PyPI 包的依赖结构进行量化分析，揭示了 Python 软件供应链中广泛存在且易被忽视的漏洞依赖问题，旨在提升业界对 Python 供应链安全的关注。

Jacob Mahon, Chenxi Hou, Zhihao Yao2026-03-11💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

本文提出了名为 FieldLVLM 的新框架，通过结合物理特征提取的领域感知语言生成策略与数据压缩的多模态模型微调，显著提升了大型视觉语言模型对流场等科学领域数据的理解能力。

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang Zhang2026-03-11💻 cs

Analysis and virtual element discretisation of a Stokes/Biot--Kirchhoff bulk--surface model

本文提出并分析了一种用于模拟斯托克斯流与 Biot-Kirchhoff 多孔弹性板耦合的 3D-2D 模型，通过证明其连续与离散形式的适定性及最优收敛性，展示了该方法在硅纳米孔膜免疫隔离封装模拟中的应用。

Franco Dassi, Rekha Khot, Andres E. Rubiano + 1 more2026-03-11💻 cs

A robust and compliant robotic assembly control strategy for batch precision assembly task with uncertain fit types and fit amounts

本文针对具有不确定配合类型和配合量的批量化精密装配任务，提出了一种基于力 - 视觉融合控制器驱动的多任务强化学习与多教师策略蒸馏相结合的方法，成功构建并验证了能够适应不同配合状态、兼具高训练效率与优异力顺应性的鲁棒机器人装配控制策略。

Bin Wang, Jiwen Zhang, Song Wang + 1 more2026-03-11💻 cs

Graph-Based Deterministic Polynomial Algorithm for NP Problems

该论文提出了一种基于图计算框架的确定性多项式时间算法，通过利用边重叠特性及局部不可行性修剪机制，在不显式枚举证书的情况下将 NP 问题的验证复杂度降至多项式级别，从而给出了 P=NP 的构造性证明。

Changryeol Lee2026-03-11💻 cs

You Only Pose Once: A Minimalist's Detection Transformer for Monocular RGB Category-level 9D Multi-Object Pose Estimation

本文提出了YOPO，一种单阶段、基于查询的极简检测Transformer框架，仅需单目RGB图像和类别级标签即可实现端到端的9自由度多物体姿态估计，并在多个基准测试中刷新了仅用RGB数据的性能纪录。

Hakjin Lee, Junghoon Seo, Jaehoon Sim2026-03-11💻 cs

cs