Randomized Space-Time Stacked Intelligent Metasurfaces for Massive Multiuser Downlink Connectivity

Este artigo propõe uma arquitetura inovadora de Metasuperfícies Inteligentes Empilhadas (SIM) com codificação espaço-tempo aleatória que, ao introduzir variações temporais artificiais e utilizar um esquema de feixe baseado em CSIT parcial, permite o agendamento oportunista de usuários e a exploração da diversidade multiusuário, alcançando alto desempenho de taxa soma com overhead reduzido de aquisição e feedback de informação de canal em redes de downlink massivo.

Donatella Darsena, Ivan Iudice, Vincenzo Galdi, Francesco VerdeWed, 11 Ma⚡ eess

From Demonstrations to Safe Deployment: Path-Consistent Safety Filtering for Diffusion Policies

O artigo propõe o filtro de segurança PACS, que utiliza frenagem consistente com o trajeto e análise de alcançabilidade baseada em conjuntos para garantir segurança formal em políticas de difusão sem comprometer a taxa de sucesso das tarefas ou desviar da distribuição de treinamento.

Ralf Römer, Julian Balletshofer, Jakob Thumm, Marco Pavone, Angela P. Schoellig, Matthias AlthoffWed, 11 Ma⚡ eess

Tiled Beamspace MVDR for 1024-element Wideband Radar

Este artigo apresenta uma arquitetura baseada em "tiles" para a formação de feixes digital eficiente em termos computacionais em radares MIMO massivos de banda larga, demonstrando que a combinação de redução de dimensionalidade no espaço de feixes por tile com o treinamento coordenado de filtros MVDR reduzidos supera significativamente o processamento de um único tile ao lidar com 1024 elementos e interferências fortes.

Oveys Delafrooz Noroozi, Jiyoon Han, Wei Tang, Zhengya Zhang, Upamanyu MadhowWed, 11 Ma⚡ eess

LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery

O artigo apresenta o LiM-YOLO, um detector de navios otimizado para imagens de sensoriamento remoto que, ao deslocar os níveis da pirâmide de características de P3-P5 para P2-P4 e empregar normalização por grupos, resolve desafios de escala e estabilidade de treinamento, alcançando precisão superior com menos parâmetros.

Seon-Hoon Kim, Hyeji Sim, Youeyun Jung, Ok-Chul Jung, Yerin KimWed, 11 Ma⚡ eess

Rethinking Discrete Speech Representation Tokens for Accent Generation

Este artigo apresenta a primeira investigação sistemática sobre como as informações de sotaque são codificadas em Tokens de Representação Discreta de Fala (DSRTs), propondo um novo quadro de avaliação que revela que a escolha das camadas é o fator mais crítico para reter essas informações, enquanto a supervisão de ASR as reduz significativamente e a redução ingênua do tamanho do código não consegue separá-las eficazmente de fonética e identidade do falante.

Jinzuomu Zhong, Yi Wang, Korin Richmond, Peter BellWed, 11 Ma⚡ eess

Exploiting Completeness Perception with Diffusion Transformer for Unified 3D MRI Synthesis

O artigo apresenta o CoPeDiT, um modelo de difusão latente unificado equipado com percepção de completude que, ao inferir automaticamente estados de dados ausentes sem necessidade de guias externos, supera os métodos atuais na síntese de alta fidelidade e consistência estrutural de ressonâncias magnéticas 3D.

Junkai Liu, Nay Aung, Theodoros N. Arvanitis, Joao A. C. Lima, Steffen E. Petersen, Le ZhangWed, 11 Ma⚡ eess

Predictive Control with Indirect Adaptive Laws for Payload Transportation by Quadrupedal Robots

Este artigo apresenta um novo framework hierárquico de controle preditivo com leis adaptativas indiretas que permite a robôs quadrúpedes transportar cargas estáticas e dinâmicas desconhecidas em terrenos acidentados com alta estabilidade e desempenho superior em comparação a métodos convencionais.

Leila Amanzadeh, Taizoon Chunawala, Randall T. Fawcett, Alexander Leonessa, Kaveh Akbari HamedWed, 11 Ma⚡ eess

Formation-Aware Adaptive Conformalized Perception for Safe Leader-Follower Multi-Robot Systems

Este artigo propõe um método de predição conformal adaptativa e consciente da formação, baseado em Risk-Aware Mondrian CP, para garantir a segurança e a visibilidade em sistemas multi-robô líder-seguidor ao gerar limites de incerteza que se ajustam dinamicamente às configurações de risco, resultando em taxas de sucesso e precisão de rastreamento superiores em simulações.

Richie R. Suganda, Bin HuWed, 11 Ma⚡ eess

Can You Hear, Localize, and Segment Continually? An Exemplar-Free Continual Learning Benchmark for Audio-Visual Segmentation

Este artigo apresenta o primeiro benchmark de aprendizado contínuo sem exemplares para Segmentação Áudio-Visual, introduzindo o modelo ATLAS com ancoragem de baixo rank para mitigar o esquecimento catastrófico e permitir que sistemas aprendam continuamente a localizar e segmentar objetos sonoros em ambientes dinâmicos.

Siddeshwar Raghavan, Gautham Vinod, Bruce Coburn, Fengqing ZhuWed, 11 Ma⚡ eess

Universal Speech Content Factorization

O artigo propõe a Universal Speech Content Factorization (USCF), um método linear simples e invertível que extrai representações de fala de baixo posto preservando o conteúdo fonético enquanto suprime o timbre do locutor, permitindo conversão de voz zero-shot e treinamento eficiente de modelos de síntese de fala.

Henry Li Xinyuan, Zexin Cai, Lin Zhang, Leibny Paola García-Perera, Berrak Sisman, Sanjeev Khudanpur, Nicholas Andrews, Matthew WiesnerWed, 11 Ma⚡ eess