ParaS2S: Benchmarking and Aligning Spoken Language Models for Paralinguistic-aware Speech-to-Speech Interaction

El artículo presenta ParaS2S, un nuevo marco de aprendizaje por refuerzo y un benchmark (ParaS2SBench) que optimizan la capacidad de los modelos de voz a voz para responder adecuadamente tanto en contenido como en estilo paralingüístico, superando a los enfoques anteriores con menos datos de entrenamiento.

Shu-wen Yang, Ming Tu, Andy T. Liu, Xinghua Qu, Hung-yi Lee, Lu Lu, Yuxuan Wang, Yonghui WuMon, 09 Ma⚡ eess

On the Tail Transition of First Arrival Position Channels: From Cauchy to Exponential Decay

Este artículo caracteriza la transición inducida por la deriva en los canales de posición de primera llegada, identificando una distancia de propagación característica que separa el régimen de difusión de cola pesada (distribución de Cauchy) del régimen regularizado de decaimiento exponencial, y demuestra que las aproximaciones gaussianas subestiman severamente el potencial de comunicación en entornos de baja deriva.

Yen-Chi LeeMon, 09 Ma🔢 math

Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility

Este estudio presenta un marco híbrido de GeoAI que integra MGWR, Random Forest y ST-GCN para modelar con alta precisión la heterogeneidad espaciotemporal de los flujos de tráfico multimodal y su interacción con el uso del suelo, demostrando su superioridad frente a modelos convencionales y ofreciendo una herramienta interpretable para la planificación urbana basada en evidencia.

Olaf Yunus Laitinen ImanovMon, 09 Ma🤖 cs.AI

A Survey on Stacked Intelligent Metasurfaces: Fundamentals, Recent Advances, and Challenges

Esta encuesta ofrece una visión integral de las metasuperficies inteligentes apiladas (SIM), abarcando sus principios físicos, marcos de modelado, realizaciones de hardware y aplicaciones emergentes en comunicaciones de próxima generación, mientras identifica desafíos clave para su implementación en sistemas 6G.

Chandan Kumar Sheemar, Wali Ullah Khan, Sourabh Solanki, George C. Alexandropoulos, Symeon ChatzinotasMon, 09 Ma🔢 math

Frequency Response of Windowed DFT Phasor Estimation: Impact on Oscillation Observability

Esta carta deriva la respuesta de frecuencia compleja completa del estimador de fasores basado en la transformada discreta de Fourier (DFT) con ventana, demostrando cómo la ventana introduce atenuación y desplazamiento de fase en las componentes de oscilación, y propone un método de recuperación para restaurar la amplitud y fase reales a partir de los datos de las unidades de medición de fasores (PMU).

Jiahui Yang, Yuru Wu, Haozong Wang, Yu Liu, Biao Sun, Yilu Liu, Clifton BlackMon, 09 Ma⚡ eess

In-Wave Computation Aided Stacked Intelligent Metasurfaces in Next-Generation Networks: Challenges and Opportunities

Este artículo revisa el estado del arte de las superficies inteligentes apiladas (SIM), que permiten la computación en el dominio de las ondas para mejorar la eficiencia energética y la latencia en redes de próxima generación, al tiempo que identifica los desafíos actuales y explora futuras direcciones para establecerlas como un nuevo paradigma de procesamiento de señales.

Mengbing Liu, Chau Yuen, Dusit Niyato, Bruno Clerckx, Lajos HanzoMon, 09 Ma⚡ eess

Ill-Posedness Analysis of CSI-Based Electromagnetic Inverse Scattering for Material Reconstruction in ISAC Systems

Este artículo analiza la mal condicionamiento de la dispersión inversa electromagnética basada en información de estado del canal (CSI) en sistemas ISAC, demostrando que restringir la región de interés alrededor del dispersor real reduce el número de condición y mejora la reconstrucción de materiales mediante un marco de programación cuadrática validado por simulaciones.

Yubin Luo, Li Yu, Takumi Takahashi, Shaoyi Liu, Yuxiang Zhang, Jianhua Zhang, Hideki OchiaiMon, 09 Ma⚡ eess

Channel Estimation for Reconfigurable Intelligent Surface Assisted Upper Mid-Band MIMO Systems

Este artículo propone un marco de estimación de canal consciente de la condición para sistemas MIMO asistidos por superficies inteligentes reconfigurables en la banda media superior, que transforma un problema mal condicionado en subproblemas bien condicionados mediante agrupación de columnas y diseño de fases por tramos, logrando un rendimiento robusto sin depender de suposiciones de dispersión.

Jeongjae Lee, Chanwon Kim, Songnam HongMon, 09 Ma⚡ eess

STAR Beyond Diagonal RISs with Amplification: Modeling and Optimization

Este artículo propone un modelo de señal físicamente consistente y un marco de optimización basado en la alternancia para RISs STAR con amplificación por elemento y división de potencia sin pérdidas, demostrando mediante resultados numéricos ganancias sustanciales en la tasa de suma respecto a los RISs BD pasivos convencionales.

Chandan Kumar Sheemar, Giovanni Iacovelli, Wali Ullah Khan, George C. Alexandropoulos, Stefano Tomasin, Symeon ChatzinotasMon, 09 Ma🔢 math

Reinforcement Learning for Secrecy Optimization in Underwater Energy Harvesting Relay Network

Este artículo propone una estrategia de asignación óptima de potencia basada en aprendizaje por refuerzo para maximizar el rendimiento de seguridad a largo plazo en redes de relés de recolección de energía submarinas con transmisión híbrida óptico-acústica, demostrando su superioridad frente a algoritmos greedy y naive en entornos con turbulencia, obstáculos y escuchas no autorizadas.

Shalini Tripathi, Ankur Bansal, Chinmoy KunduMon, 09 Ma⚡ eess

A Retrieval-Assisted Framework for Wireless Localization

Este artículo propone un marco unificado de localización asistida por recuperación que combina el mapeo de canales para la búsqueda eficiente de puntos de referencia y una red de atención gráfica para modelar correlaciones espaciales, logrando así una estimación de posición más precisa y escalable que los métodos existentes basados en huellas dactilares de CSI.

Haoyu Huang, Guangjin Pan, Kaixuan Huang, Shunqing Zhang, Yuhao Zhang, Musa Furkan Keskin, Zheng Xing, Henk WymeerschMon, 09 Ma⚡ eess

On the Secrecy Performance of Continuous-Aperture Arrays Over Fading Channels

Este artículo analiza el rendimiento de seguridad de las redes de apertura continua (CAPA) en canales de desvanecimiento, demostrando teóricamente y validando mediante simulaciones que superan a las redes de antenas discretas en términos de tasa de secreto y probabilidad de interrupción de secreto, con una diversidad igual a los grados de libertad espaciales.

Xuan Yang, Chongjun Ouyang, Dongming Li, Yuanwei LiuMon, 09 Ma🔢 math

MAD: A Multimodal and Multi-perspective Affective Dataset with Hierarchical Annotations

Este trabajo presenta MAD, un nuevo conjunto de datos multimodal y multivista con anotaciones jerárquicas que sincroniza señales fisiológicas (como EEG y ECG) con videos faciales RGB-D de 18 participantes para modelar la dinámica emocional desde perspectivas neural, fisiológica y conductual, validando su utilidad mediante experimentos de reconocimiento de emociones y análisis de mecanismos afectivos.

Shengwei Guo, Yunqing Qiao, Wenzhan Zhang, Bo Liu, Yong Wang, Guobing SunMon, 09 Ma⚡ eess