ParaS2S: Benchmarking and Aligning Spoken Language Models for Paralinguistic-aware Speech-to-Speech Interaction

この論文は、話者の感情やトーンなどの副言語的要素を適切に扱える音声対話モデルの構築を目指し、新しい強化学習フレームワーク「ParaS2S」と高品質な評価ベンチマーク「ParaS2SBench」を提案し、既存のモデルや教師あり微細化(SFT)を上回る性能を達成したことを報告しています。

Shu-wen Yang, Ming Tu, Andy T. Liu, Xinghua Qu, Hung-yi Lee, Lu Lu, Yuxuan Wang, Yonghui WuMon, 09 Ma⚡ eess

On the Tail Transition of First Arrival Position Channels: From Cauchy to Exponential Decay

この論文は、非ゼロのドリフトがゼロドリフトのファーストアライバル位置チャネルの重尾分布(コーシー分布)を指数関数的な減衰へと変容させる過程を解析し、拡散支配領域とドリフト支配領域を分ける特徴的な伝播距離を特定するとともに、低ドリフト環境におけるガウス近似の限界とコーシー分布の妥当性を示しています。

Yen-Chi LeeMon, 09 Ma🔢 math

The MIMO-ME-MS Channel: Analysis and Algorithm for Secure MIMO Integrated Sensing and Communications

本論文は、複数のアンテナを持つ盗聴者と感知受信機を備えた MIMO 統合センシング・通信システムにおけるセキュアなプリコーダ設計問題を扱い、高 SNR 解析に基づく準最適プリコーダの構造を明らかにするとともに、非凸最適化問題を解決する実用的な 2 段階反復アルゴリズムを提案し、その有効性を示しています。

Seongkyu Jung, Namyoon Lee, Jeonghun ParkMon, 09 Ma⚡ eess

Neural Signals Generate Clinical Notes in the Wild

この論文は、9,048 人の患者から収集した約 11,000 時間の EEG 記録と 9,922 件の臨床報告書を用いて、長時間の EEG 記録から臨床レポートを生成する初の基盤モデル「CELM」を開発し、患者の病歴を考慮した場合やゼロショット設定において既存手法を大幅に上回る性能を達成したことを報告しています。

Jathurshan Pradeepkumar, Zheng Chen, Jimeng SunMon, 09 Ma🤖 cs.AI

Physics Informed Deep Unfolded Full Waveform Inversion for Edema Detection

本研究は、従来のフル波形逆解析(FWI)の計算コストと局所解の問題を解決し、実時間での浮腫検出を可能にする「物理情報に基づく深層学習展開型 FWI(DUFWI)」を提案し、シミュレーションおよびハードウェア実験において高い再構成精度と計算効率を実証したものである。

Ruizhi Zhang, Yhonatan Kvich, Rui Guo, Oded Cohen, Yonina C. EldarMon, 09 Ma⚡ eess

Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility

本論文は、MGWR、ランダムフォレスト、ST-GCN を統合した GeoAI ハイブリッド枠組みを提案し、土地利用と多モーダル交通需要の複雑な時空間的相互作用を高精度に解明することで、都市計画や交通政策への新たな知見を提供しています。

Olaf Yunus Laitinen ImanovMon, 09 Ma🤖 cs.AI

A Survey on Stacked Intelligent Metasurfaces: Fundamentals, Recent Advances, and Challenges

本論文は、波の伝播を通じて複数のプログラム可能メタサーフェス層が相互作用する積層型インテリジェントメタサーフェス(SIM)の物理原理、モデリング、ハードウェア実装、および通信機能や将来の 6G システムへの応用に関する包括的な調査と課題をまとめたものである。

Chandan Kumar Sheemar, Wali Ullah Khan, Sourabh Solanki, George C. Alexandropoulos, Symeon ChatzinotasMon, 09 Ma🔢 math

Frequency Response of Windowed DFT Phasor Estimation: Impact on Oscillation Observability

本論文は、窓関数を適用した離散フーリエ変換に基づくフェーザ推定が振動観測に及ぼす影響を完全な複素周波数応答として解析し、既知の複素利得を用いた振動振幅と位相の回復手法を提案するとともに、その有効性を時領域シミュレーションで検証している。

Jiahui Yang, Yuru Wu, Haozong Wang, Yu Liu, Biao Sun, Yilu Liu, Clifton BlackMon, 09 Ma⚡ eess

Rethinking Next-Generation Signal Waveform: Integration of Orthogonality and Non-Orthogonality

本論文は、6G 通信の要件を満たしつつ既存標準との互換性を維持するため、直交性と非直交性を統合した波形(特に SC-NOFS(2D))を提案し、高いデータレート、低遅延、高移動性への耐性など次世代通信に不可欠な特性を備えた汎用的なソリューションとして位置づけています。

Tongyang Xu, Shuangyang Li, Zhongxiang Wei, Gan Zheng, Izzat DarwazehMon, 09 Ma⚡ eess

In-Wave Computation Aided Stacked Intelligent Metasurfaces in Next-Generation Networks: Challenges and Opportunities

本論文は、信号伝搬中に波ドメインで処理を行う積層型インテリジェントメタサーフェス(SIM)の現状、応用例、および将来の次世代ネットワークにおける課題と機会を包括的にレビューし、新たな信号処理パラダイムとしての可能性を論じています。

Mengbing Liu, Chau Yuen, Dusit Niyato, Bruno Clerckx, Lajos HanzoMon, 09 Ma⚡ eess

Multi-Shot Quantum Sensing for RF Signal Detection with MIMO Rydberg-Atom Receivers

本論文は、リシアン統計に従う非ガウス性の測定値を扱うために、MIMO ライデリア原子受信機における多ショット量子センシングの統一的統計モデルを確立し、位相平均尤度比検定などの最適検出器を導出することで、古典的検出器を凌駕する RF 信号検出性能を実現することを示しています。

Saman Atapattu, Harini Hapuarachchi, Nathan RossMon, 09 Ma⚛️ quant-ph

Channel Estimation for Reconfigurable Intelligent Surface Assisted Upper Mid-Band MIMO Systems

本論文は、近距離場伝搬や遷移散乱により生じる強い空間相関と数値的不安定性を克服するため、貪欲な列グループ化と部分ごとの RIS 位相設計を用いて ill-conditioned な問題から安定した部分問題へ変換する条件数考慮型チャネル推定フレームワークを提案し、6G の上中帯域における従来の推定手法を大幅に凌駕する性能を実証しています。

Jeongjae Lee, Chanwon Kim, Songnam HongMon, 09 Ma⚡ eess

STAR Beyond Diagonal RISs with Amplification: Modeling and Optimization

本論文は、増幅機能と損失のない電力分割を備えた同時送受信型非対角 RIS(STAR BD-RIS)に対して、ハードウェア制約を満たす物理的に整合した信号モデルを構築し、WMMSE 問題への帰着と単調収束が保証される交互最適化アルゴリズムを提案することで、従来の受動型 BD-RIS を大幅に上回る和容量の向上を実現する手法を提示しています。

Chandan Kumar Sheemar, Giovanni Iacovelli, Wali Ullah Khan, George C. Alexandropoulos, Stefano Tomasin, Symeon ChatzinotasMon, 09 Ma🔢 math

Reinforcement Learning for Secrecy Optimization in Underwater Energy Harvesting Relay Network

本論文は、混合光・音響伝送を行う水中エネルギー収集リレーネットワークにおいて、モデルベース強化学習を用いた最適電力配分戦略を提案し、電池残量やチャネル状態、光リンクの可用性を考慮した長期的な秘匿性能の最大化を実現することを示しています。

Shalini Tripathi, Ankur Bansal, Chinmoy KunduMon, 09 Ma⚡ eess

A Retrieval-Assisted Framework for Wireless Localization

この論文は、高次元のチャネル状態情報(CSI)を低次元潜在空間に投影して効率的な参照点検索を実現し、さらにグラフ注意ネットワークを用いて参照点間の相関を明示的にモデル化することで、既存の手法を上回る高精度かつスケーラブルな無線位置推定を可能にする統合的な検索支援フレームワークを提案するものである。

Haoyu Huang, Guangjin Pan, Kaixuan Huang, Shunqing Zhang, Yuhao Zhang, Musa Furkan Keskin, Zheng Xing, Henk WymeerschMon, 09 Ma⚡ eess

On the Secrecy Performance of Continuous-Aperture Arrays Over Fading Channels

この論文は、レイリー fading チャネルにおける連続アパーチャアレイ(CAPA)の秘匿性を解析し、単一・複数独立・複数協調の盗聴者シナリオ下での秘匿レートと秘匿アウトアウ確率を導出するとともに、CAPA が空間自由度に等しい多様度利得を達成し、従来の離散アンテナアレイよりも優れた秘匿性能を示すことを理論的およびシミュレーション的に証明しています。

Xuan Yang, Chongjun Ouyang, Dongming Li, Yuanwei LiuMon, 09 Ma🔢 math

MAD: A Multimodal and Multi-perspective Affective Dataset with Hierarchical Annotations

本論文は、脳神経・生理・行動の多角的視点から感情を捉えるため、多様な生理信号と RGB-D 動画を同期収集し、3 段階の階層アノテーションを備えた新しいマルチモーダル感情データセット「MAD」を提案し、その有効性を多様なベンチマーク実験で実証したものです。

Shengwei Guo, Yunqing Qiao, Wenzhan Zhang, Bo Liu, Yong Wang, Guobing SunMon, 09 Ma⚡ eess

Set-Prediction-Based J-Peak Detection for Pillow-Based Ballistocardiography

枕上の振動心電図(BCG)における J 波検出において、既存のセグメンテーション手法の課題を克服し、イベントレベルのセット予測アプローチを採用することで、モデルの複雑さを大幅に削減しながら検出精度を向上させる新たなフレームワークと、多被験者・多夜間の自然睡眠データセットを提案する。

Shengwei Guo, Guobing SunMon, 09 Ma⚡ eess