Data Augmentation via Mixed Class Interpolation using Cycle-Consistent Generative Adversarial Networks Applied to Cross-Domain Imagery

该论文提出了一种基于条件 CycleGAN 的混合类插值数据增强方法(C2GMA),通过利用可见光图像合成合成孔径雷达(SAR)域数据,有效解决了非可见光领域数据稀缺问题,并在冰山分类任务中将准确率提升至 75.4%,显著优于传统增强策略。

Hiroshi Sasaki, Chris G. Willcocks, Toby P. Breckon2026-03-02🤖 cs.LG

Stereo-Talker: Audio-driven 3D Human Synthesis with Prior-Guided Mixture-of-Experts

本文提出了 Stereo-Talker,一种新颖的单样本音频驱动 3D 人类视频合成系统,它通过融合大语言模型先验来生成高保真动作序列,并利用先验引导的混合专家机制优化扩散模型,从而实现了具备精确口型同步、丰富肢体表达、时间一致性及连续视角控制的高质量 3D 说话人视频生成。

Xiang Deng, Youxin Pang, Xiaochen Zhao + 6 more2026-03-02💻 cs