Indirect and Direct Multiuser Hybrid Beamforming for Far-Field and Near-Field Communications: A Deep Learning Approach

本文提出了一种基于变分最小均方误差准则的复数域端到端深度学习框架,通过利用 KKT 条件闭式消除数字预编码器,实现了在远场和近场 XL-MIMO 系统中针对多用户干扰的间接(基于信道状态信息)与直接(基于短导频)混合波束成形优化,显著提升了频谱效率并降低了计算复杂度。

Xinyang Li, Songjie Yang, Boyu Ning, Zongmiao He, Xiang Ling, Chau Yuen

发布于 Fri, 13 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文主要解决了一个非常前沿的通信难题:如何在未来的 6G 网络中,用极低的成本和极高的效率,让基站同时给很多用户“精准投送”信号,无论这些用户是离得很近还是离得很远。

为了让你轻松理解,我们可以把整个系统想象成一个拥有成千上万只“耳朵”和“嘴巴”的超级指挥家(基站),正在指挥一场宏大的交响乐(通信信号)。

以下是这篇论文的通俗解读:

1. 背景:为什么现在的指挥家不够用了?

  • 现状(5G/4G): 以前的基站就像普通的指挥家,主要靠“角度”来区分用户。比如,用户 A 在左边,用户 B 在右边,指挥家就朝左和朝右挥棒子。这就像在平地上用手电筒照人,只要角度不同,光就能分开。
  • 新挑战(6G/XL-MIMO): 未来的基站天线多到像一面巨大的墙(超大规模 MIMO)。这时候,用户不仅分“左右”,还分“远近”。
    • 近场效应: 如果用户离得特别近(比如就在基站楼下),声波(电磁波)不再是平行的直线,而是像水波一样呈球形扩散。这时候,光看角度不行了,还得看距离。
    • 难题: 指挥家(基站)要同时给几百个用户发信号,还要避免大家互相听不清(干扰)。传统的算法太慢、太复杂,算不过来;而现有的 AI 方法要么太笨(只懂角度不懂距离),要么太不稳定(训练时容易“发疯”)。

2. 核心创新:给指挥家装上了“超级大脑”

作者设计了一个端到端(End-to-End)的深度学习框架,相当于给指挥家装了一个能直接听音辨位、自动指挥的 AI 大脑。这个大脑有两个工作模式:

模式一:间接模式(有地图,直接指挥)

  • 场景: 基站已经通过某种方式知道了每个用户的确切位置(信道状态信息,CSI)。
  • 做法: AI 大脑直接看着地图,算出怎么挥棒子(模拟波束成形)效果最好。
  • 创新点(变体 MMSE): 传统的 AI 训练就像让指挥家直接猜“怎么让音乐最响亮”,这很难算,容易出错。
    • 这篇论文改了一个策略:它先算出“怎么让音乐最清晰、杂音最小”(最小均方误差),然后用数学公式直接算出数字部分的指挥棒,只让 AI 去学最难的部分(模拟部分的指挥棒)。
    • 比喻: 就像教学生做题,老师不再让学生死记硬背所有步骤,而是直接告诉学生:“公式 A 和 B 是固定的,你只需要学会怎么调整 C 这个变量,剩下的我帮你算好了。”这样学起来又快又稳。

模式二:直接模式(没地图,盲猜也能行)

  • 场景: 基站不知道用户在哪,也没时间慢慢测位置(没有显式的信道信息)。
  • 做法: 基站先发射几个短促的“哨音”(导频),用户听到后回应。AI 大脑直接根据这些回声,盲猜出指挥棒该怎么挥。
  • 创新点: 以前的方法需要先“猜位置”再“指挥”,中间容易出错。这篇论文让 AI 直接学习“回声”到“指挥棒”的映射。
    • 比喻: 就像在漆黑的房间里,你不需要先画出房间的地图,而是直接根据回声判断哪里该放镜子,哪里该放扩音器。AI 学会了这种“听声辨位”的本能。

3. 技术亮点:为什么它这么强?

  • 复数神经网络(Complex-Valued DNN):
    • 信号是有“相位”和“幅度”的(就像声音有高低和强弱)。普通的 AI 把这两个拆开算,容易算错。这个 AI 是原生复数的,就像它天生就能理解“旋转”和“波动”,算得更准。
  • 分组卷积(Grouped Convolution):
    • 基站天线成千上万,如果每个都单独算,AI 会累死。作者设计了一种“分组”机制,让 AI 像分组讨论一样,把天线分成小组,每组负责一部分探测任务。这大大减少了计算量,让 AI 跑得快。
  • 恒模约束(Constant-Modulus):
    • 硬件限制:模拟波束成形器(相位器)只能改变信号的“方向”,不能改变信号的“强弱”(就像手电筒只能转方向,不能调亮度)。
    • 作者设计了一个特殊的“归一化层”,确保 AI 输出的结果永远符合硬件的物理限制,不会教出“不可能实现”的指挥动作。

4. 效果如何?(实验结果)

  • 速度快: 在间接模式下,它的速度比传统迭代算法快几十倍,几乎可以实时响应。
  • 省资源: 在直接模式下(没地图),它只需要很少的“哨音”(导频)就能达到很好的效果。相比之下,传统方法需要发很多哨音才能猜对位置。
  • 抗干扰强: 无论是在极近的距离(近场)还是极远的距离(远场),它都能保持稳定的性能,把干扰降到最低。
  • 数据提升: 相比现有的其他 AI 方法,它的网速(频谱效率)提升了约 3 bps/Hz,这在通信领域是一个巨大的飞跃。

总结

这篇论文就像是给未来的 6G 基站设计了一套**“直觉式”的指挥系统**。

它不再依赖繁琐的数学计算和精确的地图,而是通过深度学习,让基站学会直接根据信号特征来调整天线。无论是用户离得近还是远,无论是信号强还是弱,这个系统都能像一位经验丰富的老指挥家一样,迅速、精准地指挥成千上万个天线,让每个人都能听到最清晰的“音乐”,而且还不费脑子(计算量小)。

一句话概括: 用 AI 把复杂的数学题变成了“直觉反应”,让 6G 基站能更聪明、更省电、更快速地给海量用户发信号。