TIDE: Text-Informed Dynamic Extrapolation with Step-Aware Temperature Control for Diffusion Transformers

Le papier présente TIDE, une méthode d'extrapolation sans entraînement pour les Transformers de diffusion qui permet de générer des images à des résolutions et des ratios d'aspect arbitraires en corrigeant le déséquilibre entre les jetons de texte et d'image via un mécanisme d'ancrage textuel et en éliminant les artefacts grâce à un contrôle dynamique de la température.

Yihua Liu, Fanjiang Ye, Bowen Lin, Rongyu Fang, Chengming ZhangWed, 11 Ma💻 cs

Unit Interval Selection in Random Order Streams

Cet article présente un algorithme de streaming à un passage pour le problème de sélection d'intervalles unitaires dans un ordre aléatoire, atteignant un facteur d'approximation attendu de 0,7401 avec un espace linéaire par rapport à la solution optimale, tout en établissant des limites inférieures démontrant que toute amélioration significative nécessite un espace linéaire par rapport à la taille de l'entrée.

Cezar-Mihail Alexandru, Adithya Diddapur, Magnús M. Halldórsson, Christian Konrad, Kheeran K. NaiduWed, 11 Ma💻 cs

FAME: Force-Adaptive RL for Expanding the Manipulation Envelope of a Full-Scale Humanoid

Le papier présente FAME, un cadre d'apprentissage par renforcement adaptatif aux forces qui permet à un humanoïde à échelle réelle de maintenir son équilibre et d'élargir son enveloppe de manipulation bimanuelle en estimant les forces d'interaction via la dynamique du robot, sans capteurs de couple aux poignets.

Niraj Pudasaini, Yutong Zhang, Jensen Lavering, Alessandro Roncone, Nikolaus CorrellWed, 11 Ma💻 cs

Integrating Virtual and Augmented Reality into Public Education: Opportunities and Challenges in Language Learning

Cet article examine les opportunités et les défis de l'intégration de la réalité virtuelle et augmentée dans l'apprentissage des langues au sein de l'éducation publique, en soulignant leurs effets positifs sur la motivation et le contexte tout en identifiant des obstacles techniques et cognitifs qui nécessitent des stratégies d'implémentation ciblées.

Tanja Kojic, Maurizio Vergari, Giulia-Marielena Benta, Joy Krupinski, Maximilian Warsinke, Sebastian Möller, Jan-Niklas Voigt-AntonsWed, 11 Ma💻 cs

Influence of Interactivity in Shaping User Experience and Social Acceptance of Mobile XR

Cette étude examine l'impact des degrés d'interactivité sur l'expérience utilisateur et l'acceptabilité sociale dans les applications de réalité augmentée mobile, en soulignant la nécessité d'une conception équilibrée qui intègre les considérations sociales aux évaluations d'utilisabilité.

Tanja Kojic, Maurizio Vergari, Maximilian Warsinke, Sebastian Möller, Jan-Niklas Voigt-AntonsWed, 11 Ma💻 cs

SVG-EAR: Parameter-Free Linear Compensation for Sparse Video Generation via Error-aware Routing

Le papier présente SVG-EAR, une méthode sans paramètres qui améliore l'efficacité de la génération vidéo par diffusion via un routage conscient de l'erreur et une compensation linéaire basée sur des centroïdes, permettant d'accélérer considérablement l'inférence tout en préservant la qualité visuelle.

Xuanyi Zhou, Qiuyang Mang, Shuo Yang, Haocheng Xi, Jintao Zhang, Huanzhi Mao, Joseph E. Gonzalez, Kurt Keutzer, Ion Stoica, Alvin CheungWed, 11 Ma💻 cs

SurgCalib: Gaussian Splatting-Based Hand-Eye Calibration for Robot-Assisted Minimally Invasive Surgery

Le papier présente SurgCalib, un cadre de calibration main-œil sans marqueur basé sur le Gaussian Splatting pour les robots chirurgicaux da Vinci, qui surmonte les imprécisions des encodeurs et les contraintes de stérilité en affinant la pose de l'instrument via une optimisation différentiable sous contrainte RCM.

Zijian Wu, Shuojue Yang, Yu Chung Lee, Eitan Prisman, Yueming Jin, Septimiu E. SalcudeanWed, 11 Ma💻 cs

Characterization, Analytical Planning, and Hybrid Force Control for the Inspire RH56DFX Hand

Cet article présente trois améliorations pour transformer la main robotique Inspire RH56DFX en outil de recherche fiable : une caractérisation matérielle, un modèle MuJoCo validé pour la planification de préhension et un contrôleur hybride vitesse-force, permettant d'atteindre des taux de réussite supérieurs sur des tâches d'insertion et de préhension d'objets divers.

Xuan Tan, William Xie, Nikolaus CorrellWed, 11 Ma💻 cs

Diffusion-Based Authentication of Copy Detection Patterns: A Multimodal Framework with Printer Signature Conditioning

Cet article propose un cadre d'authentification multimodal basé sur la diffusion et conditionné par l'identité de l'imprimante, qui surpasse les méthodes traditionnelles pour détecter les contrefaçons de motifs de détection de copie en exploitant les signatures spécifiques des appareils.

Bolutife Atoki, Iuliia Tkachenko, Bertrand Kerautret, Carlos Crispim-JuniorWed, 11 Ma💻 cs

"Who wants to be nagged by AI?": Investigating the Effects of Agreeableness on Older Adults' Perception of LLM-Based Voice Assistants' Explanations

Cette étude démontre que l'agréabilité des assistants vocaux basés sur les LLM améliore la confiance et l'empathie perçues par les personnes âgées dans les situations courantes, mais que cette préférence s'atténue en cas d'urgence où la clarté prime, soulignant la nécessité d'adapter l'explicabilité de l'IA au contexte et à la personnalité de l'utilisateur.

Niharika Mathur, Hasibur Rahman, Smit DesaiWed, 11 Ma💻 cs

ImpedanceDiffusion: Diffusion-Based Global Path Planning for UAV Swarm Navigation with Generative Impedance Control

Le papier présente ImpedanceDiffusion, un cadre hiérarchique utilisant la planification de trajectoires par diffusion conditionnée par l'image et un contrôle d'impédance variable pour permettre une navigation sûre et adaptative de essaims de drones dans des environnements intérieurs encombrés, validée avec un taux de réussite de 92 % lors de déploiements réels.

Faryal Batool, Yasheerah Yaqoot, Muhammad Ahsan Mustafa, Roohan Ahmed Khan, Aleksey Fedoseev, Dzmitry TsetserukouWed, 11 Ma💻 cs

Accelerating High-Order Finite Element Simulations at Extreme Scale with FP64 Tensor Cores

Ce papier présente la première utilisation des cœurs tensoriels FP64 des GPU NVIDIA, combinée à des optimisations de fusion de noyaux, pour accélérer significativement les simulations d'éléments finis d'ordre élevé à l'échelle exascale, offrant jusqu'à un doublement des performances et des gains d'efficacité énergétique de 83 % sur les architectures Grace Hopper et Grace Blackwell.

Jiqun Tu, Ian Karlin, John Camier, Veselin Dobrev, Tzanio Kolev, Stefan Henneking, Omar GhattasWed, 11 Ma💻 cs