downsampling에서는 convolution과 maxpooling으로 이미지 특징을 추출
upsampling에서는 convolution과 transpose convolution을 거쳐 원본의 크기로 복원
여기서 downsampling에서 출력된 feature map을 잘라서 추가해 추가 데이터로 사용 (Concatenate)
객체 탐지(Object Detection)
이미지에서 레이블에 맞는 객체를 찾아내는 것
bounding box(bbox) 안의 객체가 속하는 클래스에 따라 분류
IoU
객체 탐지 평가 지표
실제 bbox와 예측된 bbox의 교집합 / 두 bbox의 합집합
어떤 단계를 거쳐 분류를 진행하는지에 따라 2-stage 방식, 1-stage 방식으로 구분됨
2-stage Detector
Selective search나 Region proposal network 등과 같은 알고리즘으로부터 객체가 있을 만한 곳을 추천받고 (= regional proposal), 추천받은 지역인 **RoI(= Region of Interest)**에 대해 convolution network를 통해 분류를 수행