Randomized Space-Time Stacked Intelligent Metasurfaces for Massive Multiuser Downlink Connectivity
本文提出了一种集成随机时空编码层的新型堆叠智能超表面(SIM)架构,通过引入人工时间变化实现多用户分集增益,并结合部分信道状态信息波束成形方案,在显著降低反馈开销的同时实现了大规模下行链路的可扩展连接。
294 篇论文
本文提出了一种集成随机时空编码层的新型堆叠智能超表面(SIM)架构,通过引入人工时间变化实现多用户分集增益,并结合部分信道状态信息波束成形方案,在显著降低反馈开销的同时实现了大规模下行链路的可扩展连接。
该论文研究了在神经音频编解码器潜在空间中进行语音增强时,连续向量与离散令牌作为训练目标的性能差异,发现预测连续潜在表示优于离散令牌,非自回归模型在效率与可懂度上更具实用性,而结合编码器微调虽能显著提升增强指标,却会牺牲编解码器的重建质量。
本文提出了 WhisperVC,一种针对低资源场景的三阶段框架,通过解耦跨域对齐与语音生成,利用 Conformer-VAE 提取域不变语义表征并结合仅基于正常语音训练的生成模型,实现了高质量的耳语转正常语音转换。
该论文提出了一种结合多种水印技术的多路复用范式,包括无训练的感知自适应时频多路复用(PA-TFM)和基于模型学习的 MaskNet 框架,旨在通过利用技术互补性显著提升音频水印在神经重建及对抗攻击等复杂场景下的鲁棒性。
该论文提出了一种名为 PACS 的路径一致性安全过滤方法,通过基于集合可达性分析对扩散策略生成的轨迹进行一致性制动,在动态环境中为机器人提供形式化安全保证的同时,有效避免了传统安全机制因偏离训练分布而导致的任务性能下降。
该研究通过虚拟环境实验发现,在嘈杂的双人对话中,说话者会通过增加手势复杂度和躯干运动、提高音量来适应噪声,而听者则通过增强头部和躯干动作来优化信噪比,且中等噪声水平会轻微降低手语同步性。
本文提出了一种面向 1024 元宽带雷达的瓦片化波束空间 MVDR 架构,通过子阵级波束空间降维与跨瓦片协同训练,在保持计算可行的同时,显著提升了抑制强地面干扰并探测空中目标的能力。
该论文针对卫星遥感图像中船舶检测面临的尺度差异大和长宽比高等挑战,提出了一种名为 LiM-YOLO 的轻量化检测器,通过统计船舶尺度分布将检测头从传统的 P3-P5 层级调整为 P2-P4 层级以满足奈奎斯特采样条件,并引入组归一化线性投影模块以解决小批量训练下的梯度不稳定问题,从而在显著减少参数量的同时实现了优于现有方法的检测精度。
本文介绍了一种针对模块化自重构机器人 SnailBot 的相对定位系统设计,该系统通过融合 ArUco 标记识别、光流分析与 IMU 数据处理,实现了动态场景下鲁棒且准确的实时相对定位。
本文通过将洛伦兹多项式与完全对数凹多项式理论推广至任意凸锥 ,构建了 -洛伦兹形式及其相关锥的几何与代数性质,揭示了其与锥限制 Rayleigh 不等式、负相关性解释以及锥约束演化变分不等式系统 Lyapunov 稳定性之间的深刻联系。
本文首次系统研究了离散语音表示(DSRTs)中的口音信息编码,提出了一套包含口音 ABX 测试和跨口音语音转换的评估框架,并发现层的选择对保留口音信息影响最大,而 ASR 监督会显著削弱口音信息,且简单的码本缩减无法有效解耦口音与音素及说话人信息。
本文提出了一种结合混合触觉感知(压电与压阻传感器)与内部力优化的混合学习及模型驱动方法,通过实时检测滑移并在线调整零空间内力,实现了多指机器人夹持在 35-40 毫秒延迟内的快速闭环防滑稳定控制。
本文提出了名为 CoPeDiT 的通用潜在扩散模型,通过引入具备完整性感知能力的自编码器(CoPeVAE)和专用的 3D 扩散 Transformer 架构(MDiT3D),无需依赖外部手动指示即可自主推断缺失状态,从而实现了在多种缺失模式下具有高保真度和语义一致性的统一 3D MRI 合成。
该论文提出了一种用于五相感应电机有限状态模型预测控制(FSMPC)的神经网络调谐器,通过实验阶跃测试数据训练以优化转速环和定子电流环的控制器参数。
本文针对广域物联网传感器网络中无人机移动基站能耗受限的问题,提出了最小成本非重复访问的“移动基站最优路径(MOT)”问题,将其建模为 NP 完全问题,并设计了一种兼顾旅行成本与覆盖增益的多项式时间贪心启发式算法,仿真表明该算法在路径长度与执行时间的综合性能上比现有方法提升了 39.15%。
本文提出了一种将间接自适应律与模型预测控制相结合的分层规划控制框架,使四足机器人能够在未知静态及动态负载、地形扰动等不确定性条件下实现鲁棒的负载运输。
本文提出了一种安全增强型无源非线性模型预测控制(SEP-NMPC)框架,通过将严格无源性不等式与高阶控制障碍函数(HOCBFs)相结合,为在复杂环境中运输吊挂负载的四旋翼无人机提供了兼具渐近稳定性与碰撞避免能力的实时控制方案。
该论文提出了一种基于风险感知 Mondrian 共形预测的分布式形成感知自适应方法,通过生成随形成状态变化的不确定性分位数并将其集成到安全控制中,有效解决了异构感知误差与视野约束耦合下的多机器人编队安全跟踪问题。
该论文针对真实世界中音视频分布动态演变的挑战,首次提出了一个无样本的音视频分割持续学习基准,并设计了结合音频引导预融合条件与低秩锚定技术的 ATLAS 基线模型,以在避免灾难性遗忘的同时实现持续感知。
本文提出了一种名为通用语音内容分解(USCF)的简单可逆线性方法,该方法通过最小二乘优化学习通用语音到内容的映射,仅需少量目标语音即可在零样本条件下实现说话人音色抑制与语音内容保留,从而在语音转换和文本到语音合成任务中展现出优异的性能。