Deepfake Generation and Detection: A Benchmark and Survey

本文全面综述了深度伪造生成与检测领域的最新进展,统一了任务定义、数据集与评估指标,系统分析了换脸、表情重演、说话人脸生成、面部属性编辑及伪造检测等四个代表性方向,并通过基准测试评估了主流方法,最后探讨了该领域面临的挑战与未来研究方向。

Gan Pei, Jiangning Zhang, Menghan Hu, Zhenyu Zhang, Chengjie Wang, Yunsheng Wu, Guangtao Zhai, Jian Yang, Dacheng Tao2026-03-10💻 cs

Goldilocks Test Sets for Face Verification

该论文指出当前人脸识别测试集存在瓶颈,并提出了三个高质量、无需人工降质的挑战性测试集(Hadrian、Eclipse 和 ND-Twins),旨在通过考察属性差异、相似面孔及严格的“金发姑娘”平衡规则,揭示现有算法在识别具有显著属性差异的同一身份、属性相似的不同身份以及相似面孔(如双胞胎)时的弱点。

Haiyu Wu, Sicong Tian, Aman Bhatta, Jacob Gutierrez, Grace Bezold, Genesis Argueta, Karl Ricanek Jr., Michael C. King, Kevin W. Bowyer2026-03-10💻 cs

On Polynomial-Time Decidability of k-Negations Fragments of First-Order Theories

本文提出了一种通用框架,为证明满足特定固定参数可处理性要求的一阶理论中固定否定片段的多项式时间可判定性提供了充分条件,并成功将其应用于弱 Presburger 算术、弱线性实算术及受限 Presburger 算术等实例,证明了这些理论在任意存在量词、合取及固定数量否定符号下的多项式时间可判定性。

Christoph Haase, Alessio Mansutti, Amaury Pouly2026-03-10💻 cs

A 1.6-fJ/Spike Subthreshold Analog Spiking Neuron in 28 nm CMOS

本文介绍了一种基于 28 nm CMOS 工艺的低功耗泄漏积分发放(LIF)神经元设计,其单次脉冲能耗仅为 1.61 fJ,并通过结合监督反向传播与代理梯度技术的量化脉冲神经网络仿真,在 MNIST 数据集上实现了 82.5% 的准确率,展示了其在嵌入式机器学习应用中实现高性能与高能效的潜力。

Marwan Besrour, Takwa Omrani, Jacob Lavoie, Gabriel Martin-Hardy, Esmaeil Ranjbar Koleibi, Jeremy Menard, Konin Koua, Philippe Marcoux, Mounir Boukadoum, Rejean Fontaine2026-03-10💻 cs

InterMind: Doctor-Patient-Family Interactive Depression Assessment Empowered by Large Language Models

本文提出了由大语言模型赋能的"InterMind"系统,通过引入医生 - 患者 - 家属多方互动机制,并结合检索增强生成与思维链技术,有效解决了传统抑郁评估中角色单一及自动检测缺乏可解释性的问题,显著提升了诊断的准确性、效率与临床实用性。

Zhiyuan Zhou, Jilong Liu, Sanwang Wang, Shijie Hao, Yanrong Guo, Richang Hong2026-03-10💻 cs

ExpGest: Expressive Speaker Generation Using Diffusion Model and Hybrid Audio-Text Guidance

本文提出了 ExpGest 框架,这是一种基于扩散模型的首创性全肢体手势生成方法,通过融合音频与文本信息、引入噪声情感分类器及潜在空间对齐技术,有效解决了现有方法在情感表达、语义一致性和全身运动自然度方面的不足,实现了更具表现力和可控性的演讲者动作生成。

Yongkang Cheng, Mingjiang Liang, Shaoli Huang, Gaoge Han, Jifeng Ning, Wei Liu2026-03-10💻 cs