Le-DETR: Revisiting Real-Time Detection Transformer with Efficient Encoder Design

본 논문은 ImageNet1K 와 COCO2017 데이터셋만을 사용하여 사전 학습 비용을 약 80% 절감하면서도 YOLOv12 및 DEIM-D-FINE 등 기존 최첨단 모델들을 추론 속도와 정확도 면에서 능가하는 새로운 실시간 객체 탐지 모델 Le-DETR 을 제안합니다.

Jiannan Huang, Aditya Kane, Fengzhe Zhou, Yunchao Wei, Humphrey Shi

게시일 2026-02-25
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 문제점: "너무 비싼 재료"만 쓰는 요리사들

지금까지 최고의 물체 감지 모델들 (RT-DETR 같은 것들) 은 마치 미슐랭 스타 요리사처럼 아주 훌륭했습니다. 하지만 이 요리사들에게는 치명적인 단점이 하나 있었습니다.

  • 기존 방식의 문제: 이 요리사들은 요리를 시작하기 전에 **엄청난 양의 비싼 재료 (데이터)**를 미리 준비해야 했습니다. 보통 100 만 장의 사진 (ImageNet) 으로 기본기를 다진 뒤, 추가로 **400 만 장의 비밀 레시피 (미공개 데이터)**와 **오랜 시간의 연습 (지식 증류)**을 거쳐야만 최고의 맛을 냈습니다.
  • 결과: 이 방식은 성능은 좋았지만, 일반인 (연구자) 이 따라 하기가 너무 어려웠습니다. "비밀 재료"를 구할 수 없으니, 새로운 요리법을 개발하거나 실험해 볼 엄두를 내지 못했던 것입니다.

2. 해결책: "Le-DETR"이라는 새로운 요리법

이 논문은 **"비싼 재료가 없어도, 훌륭한 레시피만 있다면 최고의 요리를 할 수 있다"**는 것을 증명했습니다. 바로 Le-DETR입니다.

🍳 핵심 비법 1: 효율적인 주방 (EfficientNAT 백본)

기존 모델은 무거운 재료를 나르느라 지쳤습니다. Le-DETR 은 **'EfficientNAT'**라는 새로운 주방 장비를 도입했습니다.

  • 비유: 기존에는 모든 재료를 다 섞어보느라 시간이 걸렸다면, Le-DETR 은 주변의 재료만 집중해서 빠르게 섞는 기술을 썼습니다. (지역 주의력, Local Attention)
  • 효과: 비싼 비밀 재료 (400 만 장의 추가 데이터) 없이도, 일반적인 재료 (100 만 장의 공개 데이터) 만으로 기존 모델보다 더 맛있는 요리를 만들어냈습니다.

🍳 핵심 비법 2: 빠른 조리대 (NAIFI 인코더)

요리사가 재료를 다듬는 과정 (인코더) 도 더 빨라졌습니다.

  • 비유: 기존에는 모든 재료를 한 번에 살펴보는 데 시간이 걸렸다면, Le-DETR 은 가장 중요한 재료만 빠르게 골라내는 스마트한 손질법을 썼습니다.
  • 효과: 요리가 끝나는 속도가 훨씬 빨라졌지만, 맛 (정확도) 은 떨어지지 않았습니다.

3. 성과: "최고의 맛"과 "빠른 속도"를 동시에 잡다

이 새로운 레시피로 만든 요리는 기존 유명 요리사들 (YOLO 시리즈, D-FINE 등) 과 비교해도 뒤지지 않습니다.

  • 맛 (정확도): RTX 4090 이라는 최신 주방 기기에서 테스트했을 때, Le-DETR-L은 54.3 점의 높은 점수를 받았습니다. 이는 기존 최고의 모델들보다 더 높거나 비슷한 점수입니다.
  • 속도 (지연 시간): 요리를 완성하는 데 걸린 시간은 5.01 초 (실제로는 밀리초 단위) 였습니다. 이는 기존 모델들보다 훨씬 빠르거나, 비슷한 속도를 유지하면서 더 높은 정확도를 냈다는 뜻입니다.
  • 가성비: 가장 큰 장점은 재료를 80% 이상 아꼈다는 것입니다. 기존 모델이 500 만 장의 데이터를 썼다면, Le-DETR 은 100 만 장만 써도 같은, 혹은 더 좋은 결과를 냈습니다.

4. 요약: 왜 이것이 중요한가요?

이 논문은 **"복잡하고 비싼 준비 과정 없이도, 잘 설계된 기술만 있다면 최고의 성능을 낼 수 있다"**는 것을 보여줍니다.

  • 기존: "비싼 재료 (데이터) 가 없으면 좋은 요리를 못 해."
  • Le-DETR: "아니야, **요리법 (아키텍처)**만 잘 짜면, 적은 재료로도 최고의 요리를 할 수 있어."

이제 누구나 이 레시피 (코드와 가중치) 를 공개할 예정이므로, 연구자들과 개발자들이 더 쉽게 새로운 물체 감지 기술을 개발하고 실험할 수 있게 되었습니다. 마치 비밀 레시피가 공개되어 누구나 미슐랭 스타 요리를 따라 할 수 있게 된 것과 같습니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →