U-Net
·
ML & DL/Computer vision
1. U-Net U-net은 본래 의학 이미지 segmentation을 목적으로 나온 모델이다. 의학 이미지 특성상 이미지가 매우 적었고 이러한 매우 적은 수의 학습 데이터로도 정확한 이미지 세그멘테이션 성능을 보여줬다. U-net은 Fully Convolution Network(FCN)을 기반으로 구축하였으며 인코더-디코더 기반의 모델로, 인코딩 단계에서 입력 이미지의 특징을 포착할 수 있도록 채널의 수를 늘리면서 차원을 축소해 나가고, 디코딩 단계에서 저 차원으로 인코딩 된 정보를 이용하여 채널의 수를 줄이고 차원을 늘려서 고차원의 이미지를 복원한다. 1-1. Skip connection 일반적인 segmentation 모델의 인코더는 차원 축소를 거치면서 객체에 대한 위치 정보를 잃고, 디코딩 단계..
Image segmentation(recognition+localization)
·
ML & DL/Computer vision
0. Image segmentation Image segmentation은 object의 boundary를 참조하여, 해당 객체가 있는 위치를 정확히 가리키는 역할을 한다. 대부분의 image segmentation 모델은 encoder, decoder구조로 구성되어 있다. Encoder: input의 latent space representation을 인코딩 Decoder: encoder로부터 encoding된 정보로부터 decoding하고 segment map을 형성 Image segmentation은 크게 3가지로 나뉜다. 1. Semantic segmentation Image의 pixel을 semantic(의미론적)으로 분류하는 것. == 실제로 인식할 수 있는 물리적 의미 단위로 인식하는 세그멘..