Randomized Space-Time Stacked Intelligent Metasurfaces for Massive Multiuser Downlink Connectivity

本論文は、チャネルコヒーレンス時間内でのランダムな時間変動を導入した時空間符号化スタック型インテリジェントメタサーフェス(ST-SIM)を提案し、完全な送信側チャネル状態情報に依存せずとも、部分的なフィードバックと確率的ビームフォーミングによって、高密度ネットワークにおける大規模マルチユーザー下り接続のスケーラビリティと性能を向上させる手法を論じています。

Donatella Darsena, Ivan Iudice, Vincenzo Galdi, Francesco VerdeWed, 11 Ma⚡ eess

Modeling strategies for speech enhancement in the latent space of a neural audio codec

本論文は、ニューラルオーディオコーデックの潜在空間における連続ベクトルと離散トークンの比較、および自己回帰・非自己回帰モデルやエンコーダー微調整の検討を通じて、連続潜在表現の予測とエンコーダー微調整が音声強化の性能向上に最も効果的であることを示しています。

Sofiene Kammoun, Xavier Alameda-Pineda, Simon LeglaiveWed, 11 Ma⚡ eess

WhisperVC: Decoupled Cross-Domain Alignment and Speech Generation for Low-Resource Whisper-to-Normal Conversion

本論文は、 Whisper 音声から通常音声への変換を低リソース環境で実現するため、ドメイン横断的なアライメントと音声生成を分離した 3 段階のフレームワーク「WhisperVC」を提案し、AISHELL6-Whisper における高品質な変換性能と、プライバシー保護やリハビリテーションへの応用可能性を実証したものである。

Dong Liu, Juan Liu, Wei Ju, Yao Tian, Ming LiWed, 11 Ma⚡ eess

From Demonstrations to Safe Deployment: Path-Consistent Safety Filtering for Diffusion Policies

本論文は、拡散方策(DP)の学習分布を維持しつつ動的環境で形式的な安全性を保証する「経路整合性安全フィルタリング(PACS)」を提案し、実世界タスクにおいて従来の反応的安全アプローチを大幅に上回る安全性とタスク成功率を実現することを示しています。

Ralf Römer, Julian Balletshofer, Jakob Thumm, Marco Pavone, Angela P. Schoellig, Matthias AlthoffWed, 11 Ma⚡ eess

Tiled Beamspace MVDR for 1024-element Wideband Radar

本論文は、1024 素子の広帯域 Massive MIMO レーダーにおいて、アレイを 8 つのタイルに分割し、各タイルでビームスペース次元削減と周波数チャネル化を適用した上でタイル間で協調学習を行うことで、計算コストを大幅に削減しつつ、単一タイル処理や全次元 MVDR に匹敵する干渉抑制性能を実現する手法を提案しています。

Oveys Delafrooz Noroozi, Jiyoon Han, Wei Tang, Zhengya Zhang, Upamanyu MadhowWed, 11 Ma⚡ eess

LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery

この論文は、衛星画像における船舶検出の課題である極端なスケール差とアスペクト比に対処するため、検出ピラミッドレベルを P3-P5 から P2-P4 へシフトさせ、グループ正規化を用いた補助ブランチを統合した軽量かつ高精度な検出器「LiM-YOLO」を提案し、主要なベンチマークで最先端の性能を達成したことを報告しています。

Seon-Hoon Kim, Hyeji Sim, Youeyun Jung, Ok-Chul Jung, Yerin KimWed, 11 Ma⚡ eess

Relative Localization System Design for SnailBot: A Modular Self-reconfigurable Robot

本論文は、ArUco マーカー認識、オプティカルフロー解析、および IMU データ処理を統合した融合フレームワークを採用し、モジュール型自己再構成ロボット「SnailBot」の協調タスクにおける堅牢で高精度な相対位置推定を実現するシステムの設計と実装、ならびにその有効性を示す実験結果を報告するものである。

Shuhan Zhang, Tin Lun LamWed, 11 Ma⚡ eess

Rethinking Discrete Speech Representation Tokens for Accent Generation

本論文は、音声生成の基盤である離散音声表現トークン(DSRT)におけるアクセント情報の符号化を初めて体系的に調査し、アクセントの可視化と復元を評価する新たな枠組みを用いて、層の選択が最も重要であり、ASR による監督がアクセント情報を大幅に減少させること、そして単純なコードブック縮小ではアクセントを他の情報から分離できないことを明らかにしました。

Jinzuomu Zhong, Yi Wang, Korin Richmond, Peter BellWed, 11 Ma⚡ eess

Reactive Slip Control in Multifingered Grasping: Hybrid Tactile Sensing and Internal-Force Optimization

本論文は、圧電素子と圧電抵抗素子を組み合わせたハイブリッド触覚センシングと学習ベースの手法を用いて、多指ロボットハンドの把持中に発生するすべりを 50ms 未満の遅延で検知・制御し、内部力を最適化することで把持の安定化を実現する手法を提案しています。

Théo Ayral, Saifeddine Aloui, Mathieu GrossardWed, 11 Ma⚡ eess

Exploiting Completeness Perception with Diffusion Transformer for Unified 3D MRI Synthesis

本論文は、臨床現場で利用可能な外部ガイダンスに依存せず、生成モデル自身が欠損状態を自己認識して推論する「CoPeDiT」という新しい 3D MRI 合成フレームワークを提案し、欠損モダリティやスライスの補完において最先端の手法を上回る高忠実度かつ構造的に整合性の高い結果を実現したことを報告しています。

Junkai Liu, Nay Aung, Theodoros N. Arvanitis, Joao A. C. Lima, Steffen E. Petersen, Le ZhangWed, 11 Ma⚡ eess

Mobile Base Station Optimal Tour in Wide Area IoT Sensor Networks

本論文は、広域 IoT センサネットワークにおける UAV 搭載モバイル基地局の最適巡回問題(MOT)を NP 完全問題として定式化し、移動コストとカバレッジ獲得を同時に考慮する多項式時間貪欲ヒューリスティックアルゴリズムを提案することで、既存手法を 39.15% 上回る効率性を実現したことを示しています。

Sachin KadamWed, 11 Ma⚡ eess

Predictive Control with Indirect Adaptive Laws for Payload Transportation by Quadrupedal Robots

本論文は、推定されたパラメータに基づくモデル予測制御(MPC)と勾配降下法に基づく適応則を組み合わせた階層的な制御枠組みを提案し、四足歩行ロボットが平坦地および荒れた地形において、未モデル化の静的・動的なペイロードを安定して運搬できることを実証したものである。

Leila Amanzadeh, Taizoon Chunawala, Randall T. Fawcett, Alexander Leonessa, Kaveh Akbari HamedWed, 11 Ma⚡ eess

SEP-NMPC: Safety Enhanced Passivity-Based Nonlinear Model Predictive Control for a UAV Slung Payload System

この論文は、スリング荷物を吊り下げたクアッドコプターが混雑した環境で安全かつ安定して飛行できるよう、厳密な受動性不等式と高次制御バリア関数を組み込んだ「安全性強化型受動性ベース非線形モデル予測制御(SEP-NMPC)」を提案し、理論的な安定性・安全性の保証とリアルタイム性を両立させることを実証しています。

Seyedreza Rezaei, Junjie Kang, Amaldev Haridevan, Jinjun ShanWed, 11 Ma⚡ eess

Can You Hear, Localize, and Segment Continually? An Exemplar-Free Continual Learning Benchmark for Audio-Visual Segmentation

この論文は、音声と視覚信号の動的な変化に対応し、カタストロフィック・フォージングを回避するために、低ランクアンカリング(LRA)を用いた強固なベースライン「ATLAS」と、音声視覚セグメンテーションにおける最初のサンプルフリー継続学習ベンチマークを提案するものです。

Siddeshwar Raghavan, Gautham Vinod, Bruce Coburn, Fengqing ZhuWed, 11 Ma⚡ eess

Universal Speech Content Factorization

この論文は、少数の目標音声から話者固有の情報を抑制しつつ音声内容を保持する汎用的な線形手法「Universal Speech Content Factorization(USCF)」を提案し、ゼロショット音声変換や音声合成における効率的な特徴量としての有効性を示しています。

Henry Li Xinyuan, Zexin Cai, Lin Zhang, Leibny Paola García-Perera, Berrak Sisman, Sanjeev Khudanpur, Nicholas Andrews, Matthew WiesnerWed, 11 Ma⚡ eess