TIDE: Text-Informed Dynamic Extrapolation with Step-Aware Temperature Control for Diffusion Transformers

O artigo apresenta o TIDE, um método livre de treinamento para a extrapolação de resolução em Transformers de Difusão (DiT) que, ao corrigir o desequilíbrio entre tokens de texto e imagem e controlar dinamicamente a temperatura, permite a geração de imagens em resoluções e proporções arbitrárias sem degradar detalhes semânticos ou introduzir artefatos.

Yihua Liu, Fanjiang Ye, Bowen Lin, Rongyu Fang, Chengming ZhangWed, 11 Ma💻 cs

Unit Interval Selection in Random Order Streams

Este trabalho apresenta um algoritmo de fluxo de dados de uma passagem que, sob ordem aleatória de entrada, alcança um fator de aproximação esperado de 0,7401 para o problema de seleção de intervalos unitários usando espaço linear no tamanho da solução ótima, superando o limite de 2/3 estabelecido para fluxos adversariais e estabelecendo limites inferiores de espaço para aproximações ainda melhores.

Cezar-Mihail Alexandru, Adithya Diddapur, Magnús M. Halldórsson, Christian Konrad, Kheeran K. NaiduWed, 11 Ma💻 cs

Integrating Virtual and Augmented Reality into Public Education: Opportunities and Challenges in Language Learning

Este artigo analisa as oportunidades e desafios da integração da Realidade Virtual e Aumentada no ensino de línguas na educação pública, concluindo que, embora essas tecnologias aumentem a motivação e o aprendizado contextual, sua adoção eficaz exige superar barreiras técnicas e cognitivas por meio de melhorias no design, infraestrutura e formação docente.

Tanja Kojic, Maurizio Vergari, Giulia-Marielena Benta, Joy Krupinski, Maximilian Warsinke, Sebastian Möller, Jan-Niklas Voigt-AntonsWed, 11 Ma💻 cs

Influence of Interactivity in Shaping User Experience and Social Acceptance of Mobile XR

Este estudo investiga como os diferentes níveis de interatividade em aplicações de Realidade Aumentada Móvel influenciam a Experiência do Usuário e a Aceitação Social, destacando a necessidade de um equilíbrio entre usabilidade e considerações sociais para o design eficaz dessas tecnologias.

Tanja Kojic, Maurizio Vergari, Maximilian Warsinke, Sebastian Möller, Jan-Niklas Voigt-AntonsWed, 11 Ma💻 cs

SVG-EAR: Parameter-Free Linear Compensation for Sparse Video Generation via Error-aware Routing

O artigo apresenta o SVG-EAR, um método sem parâmetros que utiliza compensação linear baseada em centróides e roteamento consciente de erros para recuperar as contribuições de blocos de atenção negligenciados na geração de vídeos esparsa, alcançando acelerações de até 1,93× sem comprometer a qualidade.

Xuanyi Zhou, Qiuyang Mang, Shuo Yang, Haocheng Xi, Jintao Zhang, Huanzhi Mao, Joseph E. Gonzalez, Kurt Keutzer, Ion Stoica, Alvin CheungWed, 11 Ma💻 cs

SurgCalib: Gaussian Splatting-Based Hand-Eye Calibration for Robot-Assisted Minimally Invasive Surgery

O artigo apresenta o SurgCalib, um framework automático e sem marcadores baseado em Gaussian Splatting para calibração mão-olho no robô cirúrgico da Vinci, que supera as limitações de medições proprioceptivas e de esterilidade ao refinar a pose do instrumento cirúrgico através de um pipeline de renderização diferenciável com restrição de ponto de rotação (RCM).

Zijian Wu, Shuojue Yang, Yu Chung Lee, Eitan Prisman, Yueming Jin, Septimiu E. SalcudeanWed, 11 Ma💻 cs

Characterization, Analytical Planning, and Hybrid Force Control for the Inspire RH56DFX Hand

Este artigo apresenta três melhorias para transformar a mão robótica Inspire RH56DFX de um dispositivo de caixa preta em uma ferramenta científica: caracterização de hardware, um modelo MuJoCo validado para planejamento de preensão e um controlador híbrido de força-velocidade, os quais foram validados com sucesso em tarefas de inserção e apreensão de objetos diversos.

Xuan Tan, William Xie, Nikolaus CorrellWed, 11 Ma💻 cs

Diffusion-Based Authentication of Copy Detection Patterns: A Multimodal Framework with Printer Signature Conditioning

Este trabalho propõe um novo quadro de autenticação multimodal baseado em difusão que utiliza assinaturas de impressora e o modelo ControlNet para distinguir com maior eficácia padrões de detecção de cópia genuínos de falsificações de alta qualidade, superando métodos tradicionais e abordagens anteriores de aprendizado profundo.

Bolutife Atoki, Iuliia Tkachenko, Bertrand Kerautret, Carlos Crispim-JuniorWed, 11 Ma💻 cs

"Who wants to be nagged by AI?": Investigating the Effects of Agreeableness on Older Adults' Perception of LLM-Based Voice Assistants' Explanations

Este estudo com 70 idosos revela que, embora assistentes de voz com alto nível de amabilidade sejam percebidos como mais confiáveis e empáticos em situações rotineiras, essa preferência diminui em emergências onde a clareza prevalece sobre o tom social, indicando a necessidade de adaptar a explicabilidade da IA ao contexto e à personalidade do usuário.

Niharika Mathur, Hasibur Rahman, Smit DesaiWed, 11 Ma💻 cs

Lockbox -- A Zero Trust Architecture for Secure Processing of Sensitive Cloud Workloads

O artigo apresenta o Lockbox, uma arquitetura de Confiança Zero projetada para garantir o processamento seguro de cargas de trabalho sensíveis na nuvem, aplicando verificação explícita de confiança, isolamento forte e acesso de menor privilégio para permitir o uso de ferramentas avançadas, como IA, sem comprometer a segurança.

Vamshi Krishna Thotempudi, Mahima Agarwal, Raghav Batta, Anjali MangalWed, 11 Ma💻 cs

ImpedanceDiffusion: Diffusion-Based Global Path Planning for UAV Swarm Navigation with Generative Impedance Control

O artigo apresenta o ImpedanceDiffusion, um framework hierárquico que utiliza planejamento de trajetória global baseado em difusão, campos potenciais artificiais e controle de impedância variável semântico para permitir navegação segura e adaptativa de enxames de drones em ambientes internos desordenados, alcançando uma taxa de sucesso de 92% em testes reais.

Faryal Batool, Yasheerah Yaqoot, Muhammad Ahsan Mustafa, Roohan Ahmed Khan, Aleksey Fedoseev, Dzmitry TsetserukouWed, 11 Ma💻 cs

Accelerating High-Order Finite Element Simulations at Extreme Scale with FP64 Tensor Cores

Este artigo demonstra que a integração de núcleos tensoriais FP64 com otimizações de fusão de kernels no MFEM acelera significativamente simulações de elementos finitos de alta ordem em GPUs NVIDIA, alcançando ganhos de desempenho e eficiência energética em escala exascale, com aplicação direta em códigos de produção como o vencedor do Prêmio Gordon Bell de 2025 para previsão de tsunamis.

Jiqun Tu, Ian Karlin, John Camier, Veselin Dobrev, Tzanio Kolev, Stefan Henneking, Omar GhattasWed, 11 Ma💻 cs