Counting Through Occlusion: Framework for Open World Amodal Counting

이 논문은 가려진 객체의 특징을 텍스트 및 시각적 단서를 통해 계층적으로 재구성하고 주의 공간 일관성을 강제하는 'CountOCC' 프레임워크를 제안하여, 기존 방법론이 실패하는 가려짐 환경에서도 최첨단 성능을 보이는 개방형 전경 객체 계수 문제를 해결합니다.

Safaeid Hossain Arib, Rabeya Akter, Abdul Monaf Chowdhury, Md Jubair Ahmed Sourov, Md Mehedi Hasan

게시일 2026-03-10
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ 문제: "보이지 않는 것"을 어떻게 셀까?

상상해 보세요. 주차장에 차가 빽빽하게 들어차 있습니다. 그런데 어떤 큰 트럭이 앞을 가리고 있어서, 트럭 뒤에 숨은 차들은 보이지 않습니다.

기존의 최신 AI(컴퓨터 비전) 들은 "보이는 것만 세는" 아주 똑똑하지만, 동시에 "장님" 같은 성격을 가지고 있었습니다.

  • 기존 AI: "아, 트럭 뒤에 차가 있는 것 같아? 모르겠어. 안 보이니까 없다고 치자." (이렇게 하면 실제 차 수보다 훨씬 적게 세게 됩니다.)
  • 왜 그럴까? AI 가 트럭을 '물체'로 인식하지 않고, 그냥 '앞에 있는 검은색 덩어리'로만 인식하기 때문입니다. 트럭 뒤에 숨은 차의 특징을 기억해 낼 수 없었던 거죠.

💡 해결책: "CountOCC" - 상상력을 가진 AI

이 연구팀이 만든 CountOCC는 단순히 보는 것을 넘어, **"상상력"**을 발휘합니다.

1. "보이지 않는 조각을 다시 조립하다" (Feature Reconstruction)

마치 퍼즐을 맞추는 것처럼 생각해보세요.

  • 상황: 퍼즐의 일부 조각이 다른 물건에 가려져 있어요.
  • 기존 AI: 가려진 조각이 없으니까, 그 자리도 빈 공간이라고 생각합니다.
  • CountOCC: "잠깐, 이 주변에 차가 많잖아? 그리고 가려진 부분의 모양을 보면 뒤에 차가 있을 거야. 내가 그 가상 조각을 상상해서 만들어보자!"
  • 기술적 비유: AI 는 가려진 부분의 '특징'을 잃어버린 것이 아니라, 주변 정보와 "이건 차야"라는 텍스트 지시 (예: "빨간 차") 를 결합해, 가려진 부분에도 마치 차가 있는 것처럼 가상의 특징을 채워 넣습니다.

2. "거울 속의 나"와 비교하다 (Visual Equivalence)

이제 AI 가 만든 가상의 조각이 진짜인지 확인해야 합니다.

  • 비유: 거울을 두 개 준비합니다. 하나는 깨끗한 거울 (가려지지 않은 상태), 다른 하나는 안개가 낀 거울 (가려진 상태) 입니다.
  • CountOCC: "안개 낀 거울 속의 내가, 깨끗한 거울 속의 나와 **마음 (주의 집중 영역)**이 똑같아야 해!"
  • 기술적 비유: AI 는 가려진 상태에서도 가려지지 않은 상태와 똑같이 "차에 집중하는 눈"을 갖도록 훈련시킵니다. 이렇게 하면 가려진 물체도 마치 보이는 것처럼 정확하게 인식하게 됩니다.

🏆 결과: 얼마나 잘할까?

이 기술은 기존 방법들보다 훨씬 뛰어납니다.

  • 기존 방법: 가려진 차를 못 보고, 10 대 중 6 대만 세서 6 대라고 답함.
  • CountOCC: 가려진 차까지 상상해서 10 대를 정확히 세서 10 대라고 답함.

특히, FSC-147 (사물 인식 데이터) 과 CARPK (주차장 데이터) 같은 테스트에서, 기존 최고의 기술보다 오류율을 20~50% 이상 줄이는 놀라운 성과를 냈습니다.

🌍 왜 이게 중요할까? (실생활 예시)

이 기술은 우리 삶에 큰 변화를 줄 수 있습니다.

  1. 농업: 밀밭에서 밀 이삭이 서로 겹쳐서 가려져도, AI 가 전체 수확량을 정확히 예측할 수 있습니다.
  2. 창고 관리: 물건들이 쌓여 앞이 가려져도, 창고에 몇 개의 상품이 있는지 정확히 파악할 수 있습니다.
  3. 교통: 주차장이나 도로에서 차량이 겹쳐 있어도, 교통량을 정확히 세어 혼잡도를 분석할 수 있습니다.

📝 한 줄 요약

"CountOCC 는 AI 에게 '보이지 않는 것도 상상해서 세는 능력'을 가르쳐, 가려진 물체가 있어도 정확한 숫자를 알려주는 혁신적인 기술입니다."

이 기술은 AI 가 단순히 '보는' 것을 넘어, '이해하고 추론하는' 단계로 한 걸음 더 나아가게 했습니다.