eess.SP Arbeiten | Gist.Science

ParaS2S: Benchmarking and Aligning Spoken Language Models for Paralinguistic-aware Speech-to-Speech Interaction

Die Arbeit stellt ParaS2S vor, ein neues Reinforcement-Learning-Framework mit einem dazugehörigen Benchmark und einem automatischen Bewerter, das Sprach-zu-Sprach-Modelle effektiv darin schult, sowohl inhaltlich als auch stilistisch (z. B. Emotionen, Tonfall) auf paralinguistische Hinweise angemessen zu reagieren und dabei weniger auf paarweise annotierte Daten angewiesen ist als herkömmliche Methoden.

Shu-wen Yang, Ming Tu, Andy T. Liu, Xinghua Qu, Hung-yi Lee, Lu Lu, Yuxuan Wang, Yonghui WuMon, 09 Ma⚡ eess

On the Tail Transition of First Arrival Position Channels: From Cauchy to Exponential Decay

Dieser Artikel untersucht den Übergang der Verteilung von First-Arrival-Position-Kanälen von einem schweren Cauchy-Schwanz bei Null-Drift zu einem exponentiellen Abfall bei nichtverschwindender Drift und identifiziert eine charakteristische Ausbreitungsdistanz als Grenze zwischen diffusions- und driftdominierten Regimen.

Yen-Chi LeeMon, 09 Ma🔢 math

The MIMO-ME-MS Channel: Analysis and Algorithm for Secure MIMO Integrated Sensing and Communications

Dieser Beitrag analysiert die fundamentalen Leistungsgrenzen sicherer MIMO-Integrierte-Sensorik-und-Kommunikationssysteme mit mehreren Antennen beim Empfänger und beim Abhörer und entwickelt einen effizienten, zweistufigen iterativen Algorithmus zur Lösung des daraus resultierenden nicht-konvexen Vorcodierproblems, der signifikante Leistungsgewinne erzielt.

Seongkyu Jung, Namyoon Lee, Jeonghun ParkMon, 09 Ma⚡ eess

Neural Signals Generate Clinical Notes in the Wild

Die Autoren stellen CELM, das erste multimodale Grundlagenmodell, vor, das langfristige EEG-Aufzeichnungen direkt in klinische Berichte übersetzt und dabei durch die Integration von Patientenhistorie eine signifikante Verbesserung der Generierungsqualität erreicht.

Jathurshan Pradeepkumar, Zheng Chen, Jimeng SunMon, 09 Ma🤖 cs.AI

Physics Informed Deep Unfolded Full Waveform Inversion for Edema Detection

Die vorgestellte Arbeit stellt eine physik-informierte, tiefenlernbasierte Methode namens DUFWI vor, die durch effiziente und präzise Rekonstruktion der Schallgeschwindigkeit aus Rohdaten eine Echtzeit-Erkennung von Ödemen im Ultraschall ermöglicht und dabei herkömmliche, rechenintensive Inversionsverfahren übertrifft.

Ruizhi Zhang, Yhonatan Kvich, Rui Guo, Oded Cohen, Yonina C. EldarMon, 09 Ma⚡ eess

Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility

Diese Studie entwickelt ein GeoAI-Hybrid-Framework, das MGWR, Random Forest und ST-GCN integriert, um die nichtlinearen Wechselwirkungen zwischen Landnutzung und multimodalen Verkehrsflüssen in verschiedenen städtischen Morphologien präzise zu modellieren und dabei die Bedeutung des städtebaulichen Kontexts für die Verkehrsplanung unterstreicht.

Olaf Yunus Laitinen ImanovMon, 09 Ma🤖 cs.AI

A Survey on Stacked Intelligent Metasurfaces: Fundamentals, Recent Advances, and Challenges

Diese Übersichtsarbeit bietet eine umfassende Darstellung von gestapelten intelligenten Metasurfaces (SIMs), indem sie deren physikalische Prinzipien, Modellierungsansätze und Hardware-Realisierungen erläutert sowie deren Anwendungen zur Optimierung von Kommunikationsleistungen und als programmierbare elektromagnetische Prozessoren für zukünftige 6G-Systeme analysiert und offene Forschungsfragen identifiziert.

Chandan Kumar Sheemar, Wali Ullah Khan, Sourabh Solanki, George C. Alexandropoulos, Symeon ChatzinotasMon, 09 Ma🔢 math

Frequency Response of Windowed DFT Phasor Estimation: Impact on Oscillation Observability

Dieser Beitrag analysiert den Einfluss der Fensterung bei der DFT-basierten Phasor-Schätzung auf die Beobachtbarkeit von Oszillationen, leitet die vollständige komplexe Frequenzantwort ab und stellt eine Methode zur Korrektur von Amplituden- und Phasenverzerrungen in PMU-Daten vor.

Jiahui Yang, Yuru Wu, Haozong Wang, Yu Liu, Biao Sun, Yilu Liu, Clifton BlackMon, 09 Ma⚡ eess

Rethinking Next-Generation Signal Waveform: Integration of Orthogonality and Non-Orthogonality

Der Artikel untersucht nachhaltige physikalische Wellenformoptionen für 6G, die Orthogonalität und Nicht-Orthogonalität integrieren, und stellt fest, dass das zweidimensionale SC-NOFS-Format aufgrund seiner überlegenen spektralen Effizienz, niedrigen Latenz und Robustheit gegenüber Doppler-Effekten eine vielversprechende Lösung für zukünftige Anwendungen darstellt.

Tongyang Xu, Shuangyang Li, Zhongxiang Wei, Gan Zheng, Izzat DarwazehMon, 09 Ma⚡ eess

In-Wave Computation Aided Stacked Intelligent Metasurfaces in Next-Generation Networks: Challenges and Opportunities

Dieser Artikel bietet einen Überblick über den aktuellen Forschungsstand zu gestapelten intelligenten Metasurfaces (SIMs), die die Signalverarbeitung in den Wellenbereich verlagern, und beleuchtet dabei deren Anwendungspotenziale, offene Herausforderungen sowie zukünftige Richtungen für die nächste Generation von Netzwerken.

Mengbing Liu, Chau Yuen, Dusit Niyato, Bruno Clerckx, Lajos HanzoMon, 09 Ma⚡ eess

Multi-Shot Quantum Sensing for RF Signal Detection with MIMO Rydberg-Atom Receivers

Diese Arbeit entwickelt ein physikalisch konsistentes statistisches Modell für Mehrfach-Shot-Messungen mit Rydberg-Atom-Empfängern, leitet optimale und praxisnahe Detektoren ab und zeigt, dass bereits wenige Quanten-Shots die Nachweisleistung gegenüber klassischen Methoden erheblich steigern.

Saman Atapattu, Harini Hapuarachchi, Nathan RossMon, 09 Ma⚛️ quant-ph

Ill-Posedness Analysis of CSI-Based Electromagnetic Inverse Scattering for Material Reconstruction in ISAC Systems

Diese Arbeit analysiert die mathematischen Ursachen der Schlechtgestelltheit bei der CSI-basierten elektromagnetischen Inversen Streuung in ISAC-Systemen und zeigt, dass eine durch ein lineares Abtastverfahren ermittelte, auf das relevante Objekt beschränkte Rekonstruktion die Konditionierung des Problems signifikant verbessert und die Rekonstruktionsgenauigkeit erhöht.

Yubin Luo, Li Yu, Takumi Takahashi, Shaoyi Liu, Yuxiang Zhang, Jianhua Zhang, Hideki OchiaiMon, 09 Ma⚡ eess

Channel Estimation for Reconfigurable Intelligent Surface Assisted Upper Mid-Band MIMO Systems

Der Artikel stellt einen konditionsbewussten Rahmen zur Kanalschätzung für RIS-gestützte Upper-Mid-Band-MIMO-Systeme vor, der durch eine gierige Spaltengruppierung und eine stückweise Phasengestaltung das schlecht konditionierte Schätzproblem in gut konditionierte Teilprobleme zerlegt und so eine robuste Leistung ohne Sparsitätsannahmen ermöglicht.

Jeongjae Lee, Chanwon Kim, Songnam HongMon, 09 Ma⚡ eess

STAR Beyond Diagonal RISs with Amplification: Modeling and Optimization

Diese Arbeit stellt ein physikalisch konsistentes Signalmodell für STAR-BD-RISs mit Verstärkung vor und entwickelt einen alternierenden Optimierungsalgorithmus, der die Summenraten maximiert und dabei Hardwarebeschränkungen sowie die Passivität der Kopplungsmatrizen strikt einhält.

Chandan Kumar Sheemar, Giovanni Iacovelli, Wali Ullah Khan, George C. Alexandropoulos, Stefano Tomasin, Symeon ChatzinotasMon, 09 Ma🔢 math

Reinforcement Learning for Secrecy Optimization in Underwater Energy Harvesting Relay Network

Diese Arbeit stellt eine modellbasierte Reinforcement-Learning-Strategie zur Optimierung der Geheimhaltung in unterwasser-Energieernterelaisnetzen mit hybriden optisch-akustischen Übertragungen vor, die durch Simulationen als überlegen gegenüber gierigen und naiven Algorithmen hinsichtlich der langfristigen sicheren Datenübertragung unter dynamischen Kanal- und Batteriezuständen nachgewiesen wird.

Shalini Tripathi, Ankur Bansal, Chinmoy KunduMon, 09 Ma⚡ eess

StreamVoiceAnon+: Emotion-Preserving Streaming Speaker Anonymization via Frame-Level Acoustic Distillation

Der Paper stellt StreamVoiceAnon+ vor, ein Streaming-Verfahren zur Sprecheranonymisierung, das durch eine zweistufige Feinabstimmung mit neutralen Emotionspaaren und frame-basierter emotionaler Distillation die Emotionserhaltung signifikant verbessert, ohne die Latenz oder Intelligibilität zu beeinträchtigen.

Nikita Kuzmin, Kong Aik Lee, Eng Siong ChngMon, 09 Ma🤖 cs.AI

A Retrieval-Assisted Framework for Wireless Localization

Diese Arbeit stellt einen einheitlichen, retrievalgestützten Rahmen für die drahtlose Ortung vor, der Channel Charting zur effizienten Suche nach Referenzpunkten mit einem Graph Attention Network zur modellierten Korrelationsanalyse kombiniert, um in verschiedenen Szenarien eine überlegene Genauigkeit gegenüber bestehenden Methoden zu erreichen.

Haoyu Huang, Guangjin Pan, Kaixuan Huang, Shunqing Zhang, Yuhao Zhang, Musa Furkan Keskin, Zheng Xing, Henk WymeerschMon, 09 Ma⚡ eess

On the Secrecy Performance of Continuous-Aperture Arrays Over Fading Channels

Diese Arbeit analysiert die Geheimhaltungsleistung von Continuous-Aperture-Array-Systemen über Fading-Kanäle, leitet theoretische Ausdrücke für die Geheimhaltungsrate und die Ausfallwahrscheinlichkeit unter verschiedenen Eavesdropper-Szenarien ab und zeigt durch Simulationen, dass diese Systeme im Vergleich zu diskreten Antennenarrays eine höhere Geheimhaltungsrate und eine geringere Ausfallwahrscheinlichkeit erreichen.

Xuan Yang, Chongjun Ouyang, Dongming Li, Yuanwei LiuMon, 09 Ma🔢 math

MAD: A Multimodal and Multi-perspective Affective Dataset with Hierarchical Annotations

Die Arbeit stellt MAD vor, ein multimodales Emotionsdatenset mit synchronisierten physiologischen Signalen, RGB-D-Videos und einer dreistufigen Hierarchie von Emotionsannotationen, das als zuverlässiger Benchmark für die Erforschung emotionaler Mechanismen und die multimodale Affektanalyse dient.

Shengwei Guo, Yunqing Qiao, Wenzhan Zhang, Bo Liu, Yong Wang, Guobing SunMon, 09 Ma⚡ eess

Set-Prediction-Based J-Peak Detection for Pillow-Based Ballistocardiography

Die Autoren stellen einen neuen, effizienten J-Peak-Detektionsansatz für Kissen-basierte Ballistokardiographie vor, der auf einer neu veröffentlichten Datensammlung beruht und durch eine set-basierte Vorhersage die Notwendigkeit von dichten Segmentierungsköpfen und heuristischer Nachbearbeitung überflüssig macht.

Shengwei Guo, Guobing SunMon, 09 Ma⚡ eess

← Zurück Weiter →