ParaS2S: Benchmarking and Aligning Spoken Language Models for Paralinguistic-aware Speech-to-Speech Interaction

O artigo apresenta o ParaS2S, um novo framework de aprendizado por reforço que otimiza modelos de fala-para-fala para responder adequadamente a pistas paralinguísticas, apoiado pelo benchmark ParaS2SBench e por um avaliador automático escalável que supera os métodos tradicionais de ajuste fino supervisionado.

Shu-wen Yang, Ming Tu, Andy T. Liu, Xinghua Qu, Hung-yi Lee, Lu Lu, Yuxuan Wang, Yonghui WuMon, 09 Ma⚡ eess

On the Tail Transition of First Arrival Position Channels: From Cauchy to Exponential Decay

Esta carta caracteriza a transição induzida por deriva no canal de posição de primeira chegada, identificando uma distância de propagação característica que separa regimes dominados por difusão (com caudas pesadas do tipo Cauchy) de regimes dominados por deriva (com decaimento exponencial), demonstrando que aproximações gaussianas subestimam severamente o potencial de comunicação em ambientes de baixa deriva.

Yen-Chi LeeMon, 09 Ma🔢 math

Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility

Este estudo propõe um quadro analítico híbrido de GeoAI que integra MGWR, Random Forest e ST-GCN para modelar a heterogeneidade espaço-temporal dos fluxos de tráfego e sua interação com o uso do solo em múltiplos modos de transporte, demonstrando superioridade preditiva e fornecendo um conjunto de ferramentas interpretáveis para o planeamento urbano e de mobilidade.

Olaf Yunus Laitinen ImanovMon, 09 Ma🤖 cs.AI

A Survey on Stacked Intelligent Metasurfaces: Fundamentals, Recent Advances, and Challenges

Esta pesquisa oferece uma visão abrangente sobre as Metasuperfícies Inteligentes Empilhadas (SIMs), abordando seus princípios físicos, modelos de engenharia, realizações de hardware e aplicações emergentes para otimizar o processamento de sinais no domínio das ondas em sistemas de comunicação sem fio de próxima geração (6G).

Chandan Kumar Sheemar, Wali Ullah Khan, Sourabh Solanki, George C. Alexandropoulos, Symeon ChatzinotasMon, 09 Ma🔢 math

Frequency Response of Windowed DFT Phasor Estimation: Impact on Oscillation Observability

Este artigo analisa o impacto da resposta em frequência da estimativa de fasores baseada em DFT com janela na observabilidade de oscilações subsíncronas, derivando uma função de ganho complexo que permite corrigir atenuações e deslocamentos de fase para recuperar com precisão a amplitude e a fase reais dos dados de unidades de medição fasorial (PMUs).

Jiahui Yang, Yuru Wu, Haozong Wang, Yu Liu, Biao Sun, Yilu Liu, Clifton BlackMon, 09 Ma⚡ eess

Rethinking Next-Generation Signal Waveform: Integration of Orthogonality and Non-Orthogonality

Este artigo propõe uma abordagem sustentável para as ondas de sinal de 6G que integra ortogonalidade e não ortogonalidade, destacando o formato SC-NOFS(2D) como uma solução versátil e superior para atender aos requisitos de alta taxa de dados, baixa latência e alta mobilidade, garantindo ao mesmo tempo compatibilidade com padrões existentes.

Tongyang Xu, Shuangyang Li, Zhongxiang Wei, Gan Zheng, Izzat DarwazehMon, 09 Ma⚡ eess

In-Wave Computation Aided Stacked Intelligent Metasurfaces in Next-Generation Networks: Challenges and Opportunities

Este artigo revisa o estado da arte das Metasuperfícies Inteligentes Empilhadas (SIMs), que realizam processamento de sinais no domínio da onda para melhorar a comunicação e a computação em redes de próxima geração, destacando suas aplicações, potenciais e os desafios futuros para sua adoção como um novo paradigma de processamento.

Mengbing Liu, Chau Yuen, Dusit Niyato, Bruno Clerckx, Lajos HanzoMon, 09 Ma⚡ eess

Multi-Shot Quantum Sensing for RF Signal Detection with MIMO Rydberg-Atom Receivers

Este artigo desenvolve um modelo estatístico de múltiplos disparos para receptores de átomos de Rydberg, derivando detectores de razão de verossimilhança que superam os métodos clássicos de detecção de RF ao lidar com medições não-Gaussianas e fase-cegas, demonstrando que apenas 5 a 10 disparos quânticos são suficientes para alcançar ganhos significativos de desempenho.

Saman Atapattu, Harini Hapuarachchi, Nathan RossMon, 09 Ma⚛️ quant-ph

Ill-Posedness Analysis of CSI-Based Electromagnetic Inverse Scattering for Material Reconstruction in ISAC Systems

Este artigo analisa a origem da má condicionamento na reconstrução de materiais baseada em CSI em sistemas ISAC, demonstrando que restringir a região de interesse (ROI) melhora o número de condição e o limite inferior de Cramér-Rao, validando uma abordagem de programação quadrática que oferece melhorias significativas na estabilidade, complexidade e robustez em comparação com formulações de domínio completo.

Yubin Luo, Li Yu, Takumi Takahashi, Shaoyi Liu, Yuxiang Zhang, Jianhua Zhang, Hideki OchiaiMon, 09 Ma⚡ eess

Channel Estimation for Reconfigurable Intelligent Surface Assisted Upper Mid-Band MIMO Systems

Este artigo propõe um framework de estimação de canal consciente do condicionamento para sistemas MIMO de banda média superior assistidos por superfícies inteligentes reconfiguráveis, que transforma problemas mal condicionados em subproblemas bem condicionados através de agrupamento de colunas e design de fase por partes, superando as limitações dos métodos convencionais em regimes de propagação de campo próximo e espalhamento transitório.

Jeongjae Lee, Chanwon Kim, Songnam HongMon, 09 Ma⚡ eess

Reinforcement Learning for Secrecy Optimization in Underwater Energy Harvesting Relay Network

Este artigo propõe uma estratégia de alocação ótima de energia baseada em aprendizado por reforço para maximizar o desempenho de segurança em redes de repetidores subaquáticos com colheita de energia e transmissão híbrida óptico-acústica, superando abordagens gananciosas e ingênuas ao adaptar-se dinamicamente às condições do canal e à disponibilidade da energia.

Shalini Tripathi, Ankur Bansal, Chinmoy KunduMon, 09 Ma⚡ eess

A Retrieval-Assisted Framework for Wireless Localization

Este artigo propõe um quadro unificado de localização por impressão digital assistido por recuperação que integra projeção de canal, recuperação eficiente e redes de atenção gráfica para superar as limitações de complexidade e escalabilidade dos métodos tradicionais de localização sem fio baseados em CSI.

Haoyu Huang, Guangjin Pan, Kaixuan Huang, Shunqing Zhang, Yuhao Zhang, Musa Furkan Keskin, Zheng Xing, Henk WymeerschMon, 09 Ma⚡ eess

On the Secrecy Performance of Continuous-Aperture Arrays Over Fading Channels

Este artigo analisa o desempenho de segurança de canais de escuta baseados em arrays de abertura contínua (CAPA) sob canais de desvanecimento, demonstrando teoricamente e validando por simulação que esses sistemas superam as arrays espaciais discretas em taxa de segurança e probabilidade de interrupção de segurança, com ganhos de diversidade iguais aos graus de liberdade espaciais.

Xuan Yang, Chongjun Ouyang, Dongming Li, Yuanwei LiuMon, 09 Ma🔢 math

MAD: A Multimodal and Multi-perspective Affective Dataset with Hierarchical Annotations

Este trabalho apresenta o MAD, um novo conjunto de dados multimodal com anotações hierárquicas que integra sinais fisiológicos sincronizados (como EEG e ECG) e vídeos faciais RGB-D de 18 participantes, permitindo a análise abrangente de emoções a partir de perspectivas neural, fisiológica e comportamental para avançar a computação afetiva e a modelagem neurofisiológica.

Shengwei Guo, Yunqing Qiao, Wenzhan Zhang, Bo Liu, Yong Wang, Guobing SunMon, 09 Ma⚡ eess