본문 바로가기

AI,ML,DL 지식공유

Computer vision 전반(classification, detection, Image segmentation)

CV의 문제

 

1. Classification

2. Object Detection

3. Image Segmentation

 

 

Single Object이 포함된 이미지에서 이 사진이 어떤 물체인지 클래스를 부여하는 것이 Classification이라면

클래스를 부여함과 동시에 정확한 위치를 네모 박스로 따오는 것까지의 태스크를 Classification + Localization이다.

 

하지만 보통의 사진에는 하나의 물체만 존재하지 않으며 서로 겹쳐져서 존재하는 경우가 많다. 이에 하나의 이미지에서 Multiple object의 위치를 Bounding box 형태로 찾고 이게 어떤 클래스인지 부여하는 것을 Object Detection이라고 한다.

 

Object detection은 어떠한 물체를 찾아낼 때 가장 많이 쓰이는 CV task 이지만 이에 대한 단점은 물체의 위치를 찾을 때 꼭 네모난 Bounding box로 찾는 다는 것이다. 물체가 네모난 모양, 세모 모양, 둥근 모양 어떤 형태이든 외각을 품는 Bounding box로 테두리를 따야된다. 하지만 실제로 응용에서는 배경을 포함하지 않도록 실제 물체의 외각을 따고 싶을 수 있다. 이 경우 Instance Segmentation을 활용한다.

 

그러면 Instance Segmentation이 가장 좋은 것 아닌가요?라고 생각할 수 있는데 이 또한 응용에 따라 다르다. Instance Segmentation은 픽셀별로 Class를 모두 구별한 후 외각을 따기 때문에 속도 측면에서도 비효율적이며 외각을 따는 것에 의미가 없는 응용도 굉장히 많다.

 

어떠한 CV 테스크를 진행할 것이며 최종 목적이 무엇이냐에 따라서 단순한 Classifcation을 쓸지, Localization을 추가할지, Segmentation으로 접근할지 달라지게 된다.

'AI,ML,DL 지식공유' 카테고리의 다른 글

Batch normalization이란  (0) 2021.01.21
Label Smoothing이란  (0) 2021.01.20