Computer Vision

Object Detection (객체 검출)

수수킴 2021. 8. 17.

Classification (분류) : 여러 물체에 대해 어떤 물체인지 분류

  • 입력으로 주어진 이미지 안의 객체 Object의 종류 (Class)을 구분하는 행위

Localization : Bounding Box를 통해 위치 정보를 나타냄

  • Object가 이미지 안의 어느 위치에 있는지 위치 정보를 출력해주는 것
  • Bounding Box의 네 꼭지점 pixel 좌표가 출력되는 것이 아닌 left top, 혹은 right bottom 좌표를 출력

Object Detection  = Multi-Labeled Classification + Bounding Box Regression (Localization)

  • Object Detection (객체 검출)이란 Classification과 Localization이 동시에 수행되는 것을 의미한다.

Object Detection의 종류

  1. 1-stage Detector : Localization과 Classification을 동시에 행한다 → 비교적 빠르지만 정확도가 낮음
    • e.g. YOLO (You Look Only Once) 계열, SSD 계열
  2. 2-stage Detector : Localization과 Classification을 순차적으로 행한다 → 비교적 느리지만 정확도가 높음
    • e.g. R-CNN 계열

아래는 Computer Vision분야 Major 학회들에서 소개되었던 Object Detection 논문들의 흐름이다. (2019년 기준)

Object Detection의 구조

  1. Backbone : Input image를 feature map으로 변형시켜주는 부분 e.g. VGG16, ResNet-50
  2. Head : Backbone에서 추출한 feature map의 location 작업을 수행하는 부분 (predict classes, bounding boxes 작업이 수행됨)
    • Dense Prediction → 1-stage detector 사용
      • e.g. YOLO, SSD
      • predict classes와 boundiong box regression 부분이 통합됨
    • Sparse Prediction → 2-stage detector 사용
      • e.g. Faster R-CNN, R-FCN
      • predict classes와 bounding box regression 부분이 분리됨
  3. Neck : Backbone과 Head를 연결하는 부분
    • e.g. FPN, PAN, BiFPN, NAS-FPN
    • Feature map을 refinement (정제), reconfiguration (재구성)함

 

[참고]

 

[Object Detection] 1. Object Detection 논문 흐름 및 리뷰

Deep Learning 을 이용한 Object Detection의 최신 논문 동향의 흐름을 살펴보면서 Object Detection 분야에 대해서 살펴보고, 구조가 어떤 방식으로 되어있으며 어떤 방식으로 발전되어 왔는지 살펴보고자

nuggy875.tistory.com

 

YOLO v4 리뷰 : Optimal Speed and Accuracy of Object Detection

작성자 : 한양대학원 융합로봇시스템학과 유승환 석사과정 (CAI LAB) 오늘은 저번달에 나온 따끈 따끈한 YOLO의 새로운 버전, YOLO v4에 대해 공부해보겠다! 아카이브 기준으로 2020년 4월 23일에 YOLO v4

ropiens.tistory.com

 

댓글