TIDE: Text-Informed Dynamic Extrapolation with Step-Aware Temperature Control for Diffusion Transformers

本文提出了 TIDE,一种无需额外训练且无采样开销的文本引导动态外推方法,通过引入文本锚定机制和基于谱进展感知的动态温度控制,有效解决了扩散 Transformer 在高分辨率生成中因注意力稀释导致的结构退化与伪影问题,实现了任意分辨率和长宽比的图像生成。

Yihua Liu, Fanjiang Ye, Bowen Lin, Rongyu Fang, Chengming ZhangWed, 11 Ma💻 cs

FAME: Force-Adaptive RL for Expanding the Manipulation Envelope of a Full-Scale Humanoid

本文提出了名为 FAME 的力自适应强化学习框架,通过结合上肢姿态与双手机械交互力的潜在上下文编码,使全尺寸人形机器人(如 Unitree H12)能够在无需腕部力/力矩传感器的情况下,显著提升在外部力扰动下的站立平衡能力与操作范围。

Niraj Pudasaini, Yutong Zhang, Jensen Lavering, Alessandro Roncone, Nikolaus CorrellWed, 11 Ma💻 cs

Integrating Virtual and Augmented Reality into Public Education: Opportunities and Challenges in Language Learning

本文基于两项实证研究,探讨了虚拟现实(VR)和增强现实(AR)在公立教育语言学习中的应用,指出其虽能提升学习动机和情境化体验,但仍面临技术障碍、认知负荷及课程整合等挑战,并提出了优化界面设计、减轻认知负担及加强师资培训等实施策略。

Tanja Kojic, Maurizio Vergari, Giulia-Marielena Benta, Joy Krupinski, Maximilian Warsinke, Sebastian Möller, Jan-Niklas Voigt-AntonsWed, 11 Ma💻 cs

"Who wants to be nagged by AI?": Investigating the Effects of Agreeableness on Older Adults' Perception of LLM-Based Voice Assistants' Explanations

该研究通过 70 名老年人的实验发现,语音助手的高宜人性虽能提升日常场景下的信任与喜爱度,但在紧急情境中清晰度更为关键,且宜人性与感知智能相互独立,表明面向老年人的 AI 解释需结合个性、情境与受众进行个性化平衡。

Niharika Mathur, Hasibur Rahman, Smit DesaiWed, 11 Ma💻 cs

ImpedanceDiffusion: Diffusion-Based Global Path Planning for UAV Swarm Navigation with Generative Impedance Control

本文提出了 ImpedanceDiffusion 框架,通过结合图像条件扩散模型进行全局路径规划、人工势场法实现反应式跟踪以及基于视觉语言模型检索增强生成的语义感知可变阻抗控制,实现了无人机群在杂乱室内环境中无需显式建图即可安全、高效且自适应的协同导航。

Faryal Batool, Yasheerah Yaqoot, Muhammad Ahsan Mustafa, Roohan Ahmed Khan, Aleksey Fedoseev, Dzmitry TsetserukouWed, 11 Ma💻 cs