Activation Steering for Accent Adaptation in Speech Foundation Models

Questo studio propone un metodo di "steering" dei parametri-free per l'adattamento all'accento nei modelli fonamentali del parlato, identificando che le informazioni relative all'accento sono concentrate in un ristretto intervallo di strati intermedi e riducendo l'errore di riconoscimento lessicale modificando direttamente le attivazioni durante l'inferenza.

Jinuo Sun, Yang Xiao, Sung Kyun Chung, Qiuchi Hu, Gongping Huang, Eun-Jung Holden, Ting DangMon, 09 Ma⚡ eess

Ill-Posedness Analysis of CSI-Based Electromagnetic Inverse Scattering for Material Reconstruction in ISAC Systems

Questo articolo analizza l'ill-posedness dell'inverso scattering elettromagnetico basato su CSI nei sistemi ISAC, dimostrando che la restrizione della regione di interesse (ROI) riduce il numero di condizione e migliora la ricostruzione dei materiali, come validato da simulazioni FDTD.

Yubin Luo, Li Yu, Takumi Takahashi, Shaoyi Liu, Yuxiang Zhang, Jianhua Zhang, Hideki OchiaiMon, 09 Ma⚡ eess

Channel Estimation for Reconfigurable Intelligent Surface Assisted Upper Mid-Band MIMO Systems

Il documento propone un framework di stima del canale consapevole della condizione per sistemi MIMO a banda medio-alta assistiti da superfici intelligenti riconfigurabili, che trasforma il problema mal condizionato in sottoproblemi ben condizionati tramite raggruppamento greedy delle colonne e progettazione di fase RIS, superando così le limitazioni dei metodi tradizionali senza assumere sparsità.

Jeongjae Lee, Chanwon Kim, Songnam HongMon, 09 Ma⚡ eess

Reinforcement Learning for Secrecy Optimization in Underwater Energy Harvesting Relay Network

Questo articolo propone una strategia di allocazione ottimale della potenza basata sull'apprendimento per rinforzo per massimizzare le prestazioni di comunicazione sicura in una rete di relay ibrida ottico-acustica con raccolta di energia, dimostrando la sua superiorità rispetto ad algoritmi greedy e naive in scenari con dinamiche di batteria e condizioni del canale variabili.

Shalini Tripathi, Ankur Bansal, Chinmoy KunduMon, 09 Ma⚡ eess

A Retrieval-Assisted Framework for Wireless Localization

Questo articolo propone un quadro unificato di localizzazione assistito dal recupero che combina il channel charting per la proiezione in spazi latenti e le reti neurali a attenzione grafica per modellare le correlazioni tra i dati, superando così i limiti computazionali e di scalabilità dei metodi tradizionali di localizzazione basati su impronte digitali CSI.

Haoyu Huang, Guangjin Pan, Kaixuan Huang, Shunqing Zhang, Yuhao Zhang, Musa Furkan Keskin, Zheng Xing, Henk WymeerschMon, 09 Ma⚡ eess

MAD: A Multimodal and Multi-perspective Affective Dataset with Hierarchical Annotations

Questo lavoro presenta MAD, un nuovo dataset multimodale e multi-perspettivo con annotazioni gerarchiche che sincronizza segnali fisiologici (EEG, ECG, EOG, EMG, PPG, BCG) e video facciali RGB-D per supportare la ricerca sull'elaborazione affettiva e il riconoscimento delle emozioni da prospettive neurali, fisiologiche e comportamentali.

Shengwei Guo, Yunqing Qiao, Wenzhan Zhang, Bo Liu, Yong Wang, Guobing SunMon, 09 Ma⚡ eess

Classification of Autistic and Non-Autistic Children's Speech: A Cross-Linguistic Study in Finnish, French, and Slovak

Questo studio cross-linguistico analizza la classificazione del parlato di bambini autistici e non autistici in finlandese, francese e slovacco, rivelando che sebbene alcuni segnali acustici siano condivisi, le prestazioni dei modelli variano significativamente tra le lingue, suggerendo la necessità di approcci che tengano conto delle specificità linguistiche e delle condizioni di registrazione.

Sofoklis Kakouros, Ida-Lotta MyllyläMon, 09 Ma⚡ eess

Doctor or Patient? Synergizing Diarization and ASR for Code-Switched Hinglish Medical Conditions Extraction

Il paper presenta un sistema robusto e open-source che combina diarizzazione neurale e ASR per estrarre condizioni mediche da dialoghi clinici Hinglish sovrapposti, ottenendo il primo posto nella sfida DISPLACE-M grazie a un'architettura a cascata che supera i modelli proprietari in termini di accessibilità e competitività.

Séverin Baroudi, Yanis Labrak, Shashi Kumar, Joonas Kalda, Sergio Burdisso, Pawel Cyrta, Juan Ignacio Alvarez-Trejos, Petr Motlicek, Hervé Bredin, Ricard MarxerMon, 09 Ma⚡ eess

The DCT Model as a Novel Regression Framework within a Lagrangian Formulation

Questo articolo presenta un nuovo quadro unificato per la regressione basato sulla formalizzazione lagrangiana, in cui emerge un modello innovativo basato sulla Trasformata Discreta del Coseno (DCT) che, sfruttando le proprietà della base cosinusoidale, offre vantaggi computazionali e una migliore convergenza rispetto ai metodi polinomiali tradizionali.

Marc Martinez-Gost, Ana I. Perez Neira, Miguel Angel LagunasMon, 09 Ma⚡ eess

A Unified Multicarrier Waveform Framework for Next-generation Wireless Networks: Principles, Performance, and Challenges

Questo articolo propone un quadro unificato per le forme d'onda multicarriera, analizzando i principi di progettazione, le prestazioni e le sfide delle tecnologie esistenti come OFDM, AFDM e OTFS per guidare la selezione delle forme d'onda nelle reti mobili di sesta generazione (6G) e oltre.

Xingyao Zhang, Haoran Yin, Yanqun Tang, Yao Ge, Yong Zeng, Miaowen Wen, Zilong Liu, Yong Liang Guan, Hüseyin Arslan, Giuseppe CaireMon, 09 Ma⚡ eess