cs 篇论文 | Gist.Science

See, Plan, Rewind: Progress-Aware Vision-Language-Action Models for Robust Robotic Manipulation

本文提出了名为“见、规划、回退”（SPR）的进度感知视觉 - 语言 - 动作框架，该框架通过将语言指令动态转化为空间子目标序列，并在执行中持续监测进度、规划轨迹及在失败时回退至可恢复状态，从而在不依赖额外训练数据或辅助模型的情况下显著提升了机器人操作的鲁棒性与泛化能力。

Tingjun Dai, Mingfei Han, Tingwen Du, Zhiheng Liu, Zhihui Li, Salman Khan, Jun Yu, Xiaojun Chang2026-03-11💻 cs

Latency Effects on Multi-Dimensional QoE in Networked VR Whiteboards

该研究通过控制实验，系统分析了网络延迟对网络虚拟白板中实用性与享乐性多维体验质量的影响，并深入探讨了这种影响在不同协作模式（顺序协作与自由协作）及不同呈现形式（有无虚拟化身）下的差异，旨在为优化此类系统的实际部署提供指导。

Jiarun Song, Yongkang Hou, Fuzheng Yang2026-03-11💻 cs

CORAL: Scalable Multi-Task Robot Learning via LoRA Experts

本文提出了 CORAL 框架，通过冻结预训练 VLA 骨干网络并为每个任务分配独立的轻量级 LoRA 专家，在运行时动态切换专家以彻底消除多任务学习中的梯度冲突与灾难性遗忘，从而在真实机器人和多个仿真基准上实现了高效、可扩展的终身多任务学习。

Yuankai Luo, Woping Chen, Tong Liang, Zhenguo Li2026-03-11💻 cs

Paralinguistic Emotion-Aware Validation Timing Detection in Japanese Empathetic Spoken Dialogue

该研究提出了一种无需文本上下文、融合副语言信息与情感识别的自监督学习模型，用于检测日语共情对话中的情感验证时机，并在实验证明其显著优于传统语音基线，为构建更具共情能力的人机交互系统提供了纯语音驱动的新路径。

Zi Haur Pang, Yahui Fu, Yuan Gao, Tatsuya Kawahara2026-03-11💻 cs

External entropy supply for IoT devices employing a RISC-V Trusted Execution Environment

本文提出了一种基于 RISC-V 可信执行环境（TEE）的外部熵供应方案，通过建立受信任的服务器为资源受限的物联网设备提供加密级随机数，从而解决其熵源不足的安全难题。

Arttu Paju, Alejandro Cabrera Aldaya, Nicola Tuveri, Juha Savimäki, Marko Kivikangas, Brian McGillion2026-03-11💻 cs

IntroSVG: Learning from Rendering Feedback for Text-to-SVG Generation via an Introspective Generator-Critic Framework

本文提出了名为 IntroSVG 的生成框架，通过构建一个兼具生成与批判双重角色的统一视觉语言模型，利用监督微调、直接偏好优化以及“生成 - 审查 - 优化”的迭代闭环机制，将渲染后的视觉反馈融入训练过程，从而显著提升了文本到矢量图形（SVG）生成的质量、语义对齐度及可编辑性。

Feiyu Wang, Jiayuan Yang, Zhiyuan Zhao, Da Zhang, Bingyu Li, Peng Liu, Junyu Gao2026-03-11💻 cs

NLiPsCalib: An Efficient Calibration Framework for High-Fidelity 3D Reconstruction of Curved Visuotactile Sensors

本文提出了 NLiPsCalib 框架，通过结合可控近场光源与近场光度立体视觉技术，仅需少量日常物体接触即可高效校准弯曲视觉触觉传感器，从而显著降低高保真 3D 重建的门槛并提升其重建精度。

Xuhao Qin, Feiyu Zhao, Yatao Leng, Runze Hu, Chenxi Xiao2026-03-11💻 cs

OddGridBench: Exposing the Lack of Fine-Grained Visual Discrepancy Sensitivity in Multimodal Large Language Models

该论文提出了名为 OddGridBench 的可控基准以评估多模态大模型对细微视觉差异的敏感度，发现现有模型表现远逊于人类，并进一步通过引入课程学习与距离感知奖励的 OddGrid-GRPO 强化学习框架显著提升了模型的细粒度视觉判别能力。

Tengjin Weng, Wenhao Jiang, Jingyi Wang, Ming Li, Lin Ma, Zhong Ming2026-03-11💻 cs

Measuring onion website discovery and Tor users' interests with honeypots

该研究通过部署涵盖各类非法主题的蜜罐洋葱网站并监测其引流效果，发现人类用户主要源自 Ahmia 搜索引擎，且儿童性虐待（CSAM）主题的站点互动率显著高于其他类别，同时英语版本比多语言版本更受青睐。

Arttu Paju, Waris Abdullah, Juha Nurmi2026-03-11💻 cs

Dynamic Precision Math Engine for Linear Algebra and Trigonometry Acceleration on Xtensa LX6 Microcontrollers

本文提出并验证了一种面向 ESP32 微控制器的动态精度数学引擎，通过集成 Q16.16 定点核心、CORDIC 三角函数模块及缓存感知矩阵乘法内核，实现了在运行时灵活切换定点与浮点执行路径，从而在保持精度的同时将三角函数运算速度提升了 18.5 至 24.7 倍。

Elian Alfonso Lopez Preciado2026-03-11💻 cs

Can ChatGPT Generate Realistic Synthetic System Requirement Specifications? Results of a Case Study

该研究通过提示工程、多模型交叉验证及专家评估，证实了 ChatGPT 虽能在一定程度上生成逼真的合成系统需求规格说明书，但仍存在矛盾与缺陷，且其自动质量评估无法完全替代专家人工评审。

Alex R. Mattukat, Florian M. Braun, Horst Lichter2026-03-11💻 cs

Predictive Spectral Calibration for Source-Free Test-Time Regression

本文提出了一种名为预测谱校准（PSC）的无源测试时适应框架，通过扩展子空间对齐至块谱匹配，在无需源数据的情况下有效提升了图像回归模型在分布偏移下的性能。

Nguyen Viet Tuan Kiet, Huynh Thanh Trung, Pham Huy Hieu2026-03-11💻 cs

The Virtuous Cycle: AI-Powered Vector Search and Vector Search-Augmented AI

这篇发表于 ICDE 2026 的教程论文全面综述了人工智能与向量搜索相互促进的“良性循环”，深入探讨了 AI 如何优化向量搜索流程、向量搜索如何通过检索增强生成（RAG）赋能大语言模型，以及两者端到端协同优化的策略、挑战与未来机遇。

Jiuqi Wei, Quanqing Xu, Chuanhui Yang2026-03-11💻 cs

Robust Provably Secure Image Steganography via Latent Iterative Optimization

本文提出了一种基于潜在空间迭代优化的鲁棒且可证明安全的图像隐写框架，该方法通过接收端迭代优化潜在变量来显著提升消息提取在压缩等处理下的准确率，同时保持可证明安全性并具备作为独立模块增强其他方案的通用性。

Yanan Li, Zixuan Wang, Qiyang Xiao, Yanzhen Ren2026-03-11💻 cs

ProvAgent: Threat Detection Based on Identity-Behavior Binding and Multi-Agent Collaborative Attack Investigation

本文提出了 ProvAgent 框架，通过结合传统模型的高效初筛、基于图对比学习的细粒度身份 - 行为一致性绑定以及多智能体协作的自主调查机制，有效解决了高级持续性威胁（APT）检测中专家依赖与警报疲劳的矛盾，实现了低成本、高精度的攻击过程重构。

Wenhao Yan, Ning An, Linxu Li, Bingsheng Bi, Bo Jiang, Zhigang Lu, Baoxu Liu, Junrong Liu, Cong Dong2026-03-11💻 cs

Evidential Perfusion Physics-Informed Neural Networks with Residual Uncertainty Quantification

本文提出了一种名为 EPPINN 的框架，通过结合证据深度学习与物理信息建模，在无需贝叶斯采样或集成推理的情况下实现了对急性缺血性卒中 CT 灌注成像中物理约束违反的不确定性量化，从而在提升参数估计精度的同时显著增强了临床诊断的可靠性。

Junhyeok Lee, Minseo Choi, Han Jang, Young Hun Jeon, Heeseong Eum, Joon Jang, Chul-Ho Sohn, Kyu Sung Choi2026-03-11💻 cs

SinGeo: Unlock Single Model's Potential for Robust Cross-View Geo-Localization

SinGeo 提出了一种无需额外模块或显式变换的简单框架，通过双判别学习架构和首创的课程学习策略，使单一模型能够克服现有方法在未见视角和方向上的局限性，实现了在多种条件下的鲁棒跨视角地理定位并取得了最先进性能。

Yang Chen, Xieyuanli Chen, Junxiang Li, Jie Tang, Tao Wu2026-03-11💻 cs

A Simple Constructive Bound on Circuit Size Change Under Truth Table Perturbation

该论文明确给出了在任意固定有限完备基下，真值表单点扰动导致电路规模变化不超过 $O(n)$ 的构造性上界，并通过 telescoping 论证将其推广至一般汉明距离，同时利用 SAT 求解器在 $n=4$ 时对 AIG 基的穷举验证确认了该上界的紧性。

Kirill Krinkin2026-03-11✓ Author reviewed ⓘ💻 cs

PixelConfig: Longitudinal Measurement and Reverse-Engineering of Meta Pixel Configurations

该论文提出了名为 PixelConfig 的差分分析框架，通过逆向工程揭示了 Meta Pixel 在健康类网站等场景中默认启用高比例的活动与身份追踪功能，且即便启用了限制追踪的配置，其实际保护效果也极为有限。

Abdullah Ghani (Lahore University of Management Sciences), Yash Vekaria (University of California, Davis), Zubair Shafiq (University of California, Davis)2026-03-11💻 cs

EventVGGT: Exploring Cross-Modal Distillation for Consistent Event-based Depth Estimation

本文提出了 EventVGGT 框架，通过将事件流建模为连贯视频序列，并首创从视觉几何基础模型（VGGT）中蒸馏时空与多视图几何先验的三级策略，有效解决了现有无监督事件深度估计方法因忽略时间连续性而导致的预测不一致问题，显著提升了深度估计精度与泛化能力。

Yinrui Ren, Jinjing Zhu, Kanghao Chen, Zhuoxiao Li, Jing Ou, Zidong Cao, Tongyan Hua, Peilun Shi, Yingchun Fu, Wufan Zhao, Hui Xiong2026-03-11💻 cs