1. CNN
목적: 딥러닝에서 이미지나 영상 데이터를 처리할때 쓰임
이유: MLP(Multi-Layer Perceptron)는 모든 입력값이 flatten 되는데 이 과정에서 이미지의 정보가 손실됨. CNN은 raw input을 그대로 받아서 공간적/지역적 정보를 유지/보존함.
중요 포인트: 이미지 전체 보다는 부분을 보는것, 그리고 이미지의 한 픽셀과 주변 픽셀의 연관성을 살리는것.
CNN 구조

합성곱 (Convolution)
- Convolution Layer에서는 Convolution Filter가 sliding하며 이미지의 부분부분 특징을 읽음.
- 중요 단어:
- Filter - 가중치
- Stride - 보폭. 필터 또는 커널의 이동 단위
- Pooling:
- Max Pooling - 정해진 범위 내에서 가장 큰 값을 꺼내오는 방식
- Average Pooling - 정해진 범위 내에 있는 모든 요소의 평균을 가져오는 방식
완전 연결 신경망(Fully Connected Layer)
- 분류를 위한 완전 연결 신경망을 구축할 차례
- 완전 연결 신경망은 다층 퍼셉트론 신경망으로 구성되어 있으며
- 풀어야 하는 문제에 따라서 출력층을 잘 설계해주는 것이 중요함.
2. Beyond Classification
Segmentation - 이미지에서 픽셀단위의 같은 의미를 가지고 있는 부분을 구분
- Semantic Segmentation - 동일한 의미를 가진 모든 개체를 동일하게 라벨링
- Instance Segmentation - 동일한 의미를 가져도 각 개체를 다르게 라벨링