ParaS2S: Benchmarking and Aligning Spoken Language Models for Paralinguistic-aware Speech-to-Speech Interaction

Ce papier présente ParaS2S, un cadre d'apprentissage par renforcement et un benchmark associés conçus pour optimiser les modèles de parole-à-parole afin qu'ils répondent de manière appropriée tant sur le fond que sur le style en intégrant les indices paralinguistiques, surpassant ainsi les méthodes d'ajustement supervisé traditionnel.

Shu-wen Yang, Ming Tu, Andy T. Liu, Xinghua Qu, Hung-yi Lee, Lu Lu, Yuxuan Wang, Yonghui WuMon, 09 Ma⚡ eess

Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility

Cette étude propose un cadre d'analyse GeoAI hybride combinant MGWR, Random Forest et ST-GCN pour modéliser avec une grande précision les interactions spatio-temporelles hétérogènes entre l'usage des sols et les flux de trafic multimodaux, offrant ainsi aux urbanistes un outil interprétable pour la gestion de la mobilité et la conception de politiques foncières.

Olaf Yunus Laitinen ImanovMon, 09 Ma🤖 cs.AI

A Survey on Stacked Intelligent Metasurfaces: Fundamentals, Recent Advances, and Challenges

Cet article de synthèse offre une vue d'ensemble complète des métasurfaces intelligentes empilées (SIM), en détaillant leurs principes physiques, leurs modèles de conception et leurs réalisations matérielles, tout en examinant leurs applications prometteuses pour les systèmes de communication de la 6ᵉ génération.

Chandan Kumar Sheemar, Wali Ullah Khan, Sourabh Solanki, George C. Alexandropoulos, Symeon ChatzinotasMon, 09 Ma🔢 math

In-Wave Computation Aided Stacked Intelligent Metasurfaces in Next-Generation Networks: Challenges and Opportunities

Cet article examine les défis et les opportunités des métasurfaces intelligentes empilées (SIM) pour l'informatique en onde dans les réseaux de nouvelle génération, en présentant leur état de l'art, leurs applications potentielles et les obstacles à surmonter pour établir ce nouveau paradigme de traitement du signal.

Mengbing Liu, Chau Yuen, Dusit Niyato, Bruno Clerckx, Lajos HanzoMon, 09 Ma⚡ eess

Multi-Shot Quantum Sensing for RF Signal Detection with MIMO Rydberg-Atom Receivers

Cet article propose un modèle statistique multi-tirs pour les récepteurs à atomes de Rydberg, démontrant que des stratégies de détection optimisées, telles que le rapport de vraisemblance moyenné en phase, permettent d'atteindre des performances de détection de signaux RF bien supérieures à celles des méthodes classiques en utilisant seulement 5 à 10 mesures quantiques.

Saman Atapattu, Harini Hapuarachchi, Nathan RossMon, 09 Ma⚛️ quant-ph

Ill-Posedness Analysis of CSI-Based Electromagnetic Inverse Scattering for Material Reconstruction in ISAC Systems

Cet article analyse l'ill-posedness des problèmes de diffusion inverse basés sur les informations d'état de canal (CSI) dans les systèmes ISAC, démontre que la restriction à une région d'intérêt (ROI) améliore significativement la condition du problème et la précision de reconstruction, et propose un cadre d'optimisation quadratique contraint par la ROI validé par des simulations.

Yubin Luo, Li Yu, Takumi Takahashi, Shaoyi Liu, Yuxiang Zhang, Jianhua Zhang, Hideki OchiaiMon, 09 Ma⚡ eess

Channel Estimation for Reconfigurable Intelligent Surface Assisted Upper Mid-Band MIMO Systems

Cet article propose un cadre d'estimation de canal adapté à la conditionnement pour les systèmes MIMO assistés par surfaces intelligentes reconfigurables dans la bande supérieure intermédiaire, résolvant les problèmes de mal-conditionnement liés à la propagation en champ proche et à la corrélation spatiale par un regroupement de colonnes gourmand et une conception de phase par blocs, sans hypothèse de parcimonie.

Jeongjae Lee, Chanwon Kim, Songnam HongMon, 09 Ma⚡ eess

Reinforcement Learning for Secrecy Optimization in Underwater Energy Harvesting Relay Network

Cet article propose une stratégie d'allocation optimale de puissance basée sur l'apprentissage par renforcement pour maximiser la sécurité des communications dans un réseau de relais sous-marin à récolte d'énergie utilisant une transmission hybride optique-acoustique, surpassant ainsi des algorithmes plus simples face aux dynamiques de batterie et aux conditions de canal variables.

Shalini Tripathi, Ankur Bansal, Chinmoy KunduMon, 09 Ma⚡ eess

A Retrieval-Assisted Framework for Wireless Localization

Cet article propose un cadre unifié de localisation assisté par la récupération qui combine le charting de canal et les réseaux d'attention graphique pour surmonter les limites des méthodes existantes en matière de complexité et d'exploitation des corrélations dans les espaces CSI de haute dimension, offrant ainsi une précision supérieure dans divers scénarios.

Haoyu Huang, Guangjin Pan, Kaixuan Huang, Shunqing Zhang, Yuhao Zhang, Musa Furkan Keskin, Zheng Xing, Henk WymeerschMon, 09 Ma⚡ eess

On the Secrecy Performance of Continuous-Aperture Arrays Over Fading Channels

Cette étude analyse les performances de confidentialité des réseaux à aperture continue (CAPA) sur des canaux à évanouissement, démontrant théoriquement et par simulation qu'ils surpassent les réseaux d'antennes discrets en termes de taux de confidentialité et de probabilité de rupture de confidentialité, tout en atteignant un ordre de diversité égal aux degrés de liberté spatiaux.

Xuan Yang, Chongjun Ouyang, Dongming Li, Yuanwei LiuMon, 09 Ma🔢 math

MAD: A Multimodal and Multi-perspective Affective Dataset with Hierarchical Annotations

Ce travail présente MAD, un nouveau jeu de données multimodal et multi-perspective doté d'annotations hiérarchiques, qui synchronise des signaux physiologiques variés (EEG, ECG, etc.) et des vidéos faciales pour modéliser l'ensemble du processus émotionnel et servir de référence fiable pour la reconnaissance des émotions.

Shengwei Guo, Yunqing Qiao, Wenzhan Zhang, Bo Liu, Yong Wang, Guobing SunMon, 09 Ma⚡ eess