DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection
Der Artikel stellt DFIR-DETR vor, einen Transformer-basierten Detektor, der durch dynamische Inhalts-Feature-Aggregation, eine normerhaltende Feature-Pyramide und eine frequenzdomänenbasierte iterative Verfeinerung die Erkennung kleiner Objekte in komplexen Szenen verbessert.