Activation Steering for Accent Adaptation in Speech Foundation Models

Cet article propose une méthode d'adaptation d'accent sans paramétrage pour les modèles de base de la parole, qui identifie et contrôle les variations d'accent en injectant des vecteurs de décalage dans une couche spécifique des représentations cachées, réduisant ainsi le taux d'erreur mot sur huit accents différents.

Jinuo Sun, Yang Xiao, Sung Kyun Chung, Qiuchi Hu, Gongping Huang, Eun-Jung Holden, Ting DangMon, 09 Ma⚡ eess

In-Wave Computation Aided Stacked Intelligent Metasurfaces in Next-Generation Networks: Challenges and Opportunities

Cet article examine les défis et les opportunités des métasurfaces intelligentes empilées (SIM) pour l'informatique en onde dans les réseaux de nouvelle génération, en présentant leur état de l'art, leurs applications potentielles et les obstacles à surmonter pour établir ce nouveau paradigme de traitement du signal.

Mengbing Liu, Chau Yuen, Dusit Niyato, Bruno Clerckx, Lajos HanzoMon, 09 Ma⚡ eess

Ill-Posedness Analysis of CSI-Based Electromagnetic Inverse Scattering for Material Reconstruction in ISAC Systems

Cet article analyse l'ill-posedness des problèmes de diffusion inverse basés sur les informations d'état de canal (CSI) dans les systèmes ISAC, démontre que la restriction à une région d'intérêt (ROI) améliore significativement la condition du problème et la précision de reconstruction, et propose un cadre d'optimisation quadratique contraint par la ROI validé par des simulations.

Yubin Luo, Li Yu, Takumi Takahashi, Shaoyi Liu, Yuxiang Zhang, Jianhua Zhang, Hideki OchiaiMon, 09 Ma⚡ eess

Channel Estimation for Reconfigurable Intelligent Surface Assisted Upper Mid-Band MIMO Systems

Cet article propose un cadre d'estimation de canal adapté à la conditionnement pour les systèmes MIMO assistés par surfaces intelligentes reconfigurables dans la bande supérieure intermédiaire, résolvant les problèmes de mal-conditionnement liés à la propagation en champ proche et à la corrélation spatiale par un regroupement de colonnes gourmand et une conception de phase par blocs, sans hypothèse de parcimonie.

Jeongjae Lee, Chanwon Kim, Songnam HongMon, 09 Ma⚡ eess

Reinforcement Learning for Secrecy Optimization in Underwater Energy Harvesting Relay Network

Cet article propose une stratégie d'allocation optimale de puissance basée sur l'apprentissage par renforcement pour maximiser la sécurité des communications dans un réseau de relais sous-marin à récolte d'énergie utilisant une transmission hybride optique-acoustique, surpassant ainsi des algorithmes plus simples face aux dynamiques de batterie et aux conditions de canal variables.

Shalini Tripathi, Ankur Bansal, Chinmoy KunduMon, 09 Ma⚡ eess

A Retrieval-Assisted Framework for Wireless Localization

Cet article propose un cadre unifié de localisation assisté par la récupération qui combine le charting de canal et les réseaux d'attention graphique pour surmonter les limites des méthodes existantes en matière de complexité et d'exploitation des corrélations dans les espaces CSI de haute dimension, offrant ainsi une précision supérieure dans divers scénarios.

Haoyu Huang, Guangjin Pan, Kaixuan Huang, Shunqing Zhang, Yuhao Zhang, Musa Furkan Keskin, Zheng Xing, Henk WymeerschMon, 09 Ma⚡ eess

MAD: A Multimodal and Multi-perspective Affective Dataset with Hierarchical Annotations

Ce travail présente MAD, un nouveau jeu de données multimodal et multi-perspective doté d'annotations hiérarchiques, qui synchronise des signaux physiologiques variés (EEG, ECG, etc.) et des vidéos faciales pour modéliser l'ensemble du processus émotionnel et servir de référence fiable pour la reconnaissance des émotions.

Shengwei Guo, Yunqing Qiao, Wenzhan Zhang, Bo Liu, Yong Wang, Guobing SunMon, 09 Ma⚡ eess

Classification of Autistic and Non-Autistic Children's Speech: A Cross-Linguistic Study in Finnish, French, and Slovak

Cette étude croisée examine les capacités de classification automatique de la parole d'enfants autistes et non autistes en finnois, français et slovaque, révélant que si certains marqueurs acoustiques sont partagés, la généralisation inter-langues reste limitée et nécessite une modélisation adaptée à chaque langue.

Sofoklis Kakouros, Ida-Lotta MyllyläMon, 09 Ma⚡ eess

Cross-linguistic Prosodic Analysis of Autistic and Non-autistic Child Speech in Finnish, French and Slovak

Cette étude multilingue (finnois, français, slovaque) révèle que le profil prosodique des enfants autistes se caractérise par des marqueurs acoustiques distincts et potentiellement universels, notamment une variabilité accrue de l'intensité et une qualité de voix plus claire, remettant ainsi en question les modèles basés sur la déficience.

Ida-Lotta Myllylä, Sofoklis KakourosMon, 09 Ma⚡ eess

Doctor or Patient? Synergizing Diarization and ASR for Code-Switched Hinglish Medical Conditions Extraction

Ce papier présente un système robuste et open-source qui combine une diarisation neuronale avancée et un modèle de reconnaissance vocale adapté pour extraire efficacement les conditions médicales des dialogues cliniques en Hinglish, ayant remporté la première place du défi DISPLACE-M.

Séverin Baroudi, Yanis Labrak, Shashi Kumar, Joonas Kalda, Sergio Burdisso, Pawel Cyrta, Juan Ignacio Alvarez-Trejos, Petr Motlicek, Hervé Bredin, Ricard MarxerMon, 09 Ma⚡ eess

A Unified Multicarrier Waveform Framework for Next-generation Wireless Networks: Principles, Performance, and Challenges

Cet article propose un cadre unifié pour les formes d'onde multicporteuses de la 6G, en analysant leurs principes de conception, leurs performances et leurs défis afin de guider leur adoption dans les réseaux de nouvelle génération.

Xingyao Zhang, Haoran Yin, Yanqun Tang, Yao Ge, Yong Zeng, Miaowen Wen, Zilong Liu, Yong Liang Guan, Hüseyin Arslan, Giuseppe CaireMon, 09 Ma⚡ eess

Efficient Interference Graph Estimation via Concurrent Flooding

Ce papier propose une méthode novatrice pour estimer efficacement les graphes d'interférence dans les réseaux de capteurs sans fil en intégrant cette tâche à une inondation concurrente via le contrôle de la puissance d'émission, permettant ainsi d'économiser des ressources et de faciliter l'utilisation d'algorithmes de planification existants sur des dispositifs commerciaux.

Haifeng Jia, Yichen Wei, Zhan Wang, Jiani Jin, Haorui Li, Yibo PiFri, 13 Ma⚡ eess