AlignVAR: Towards Globally Consistent Visual Autoregression for Image Super-Resolution
本論文は、視覚的自己回帰モデルの局所性バイアスと残差学習の限界を克服し、空間的整合性を強化する「SCA」と階層的整合性制約「HCC」を導入した超解像フレームワーク「AlignVAR」を提案し、既存の拡散モデルに比べて推論速度が 10 倍以上、パラメータ数が約半分でありながら、高い構造的整合性と知覚的忠実度を実現することを示しています。