'ML & DL' 카테고리의 글 목록 (12 Page)

2023.11.10· ML & DL/파이썬 머신러닝 완벽 가이드

넘파이-Numpy-Numerical python 머신러닝의 대부분 알고리즘-선형대수, 통계 기반. >넘파이는 배열 기반의 빠른 연산 및 다양한 데이터 핸들링 기능을 제공. 넘파이 ndarray 개요 (p.14) 넘파의의 기반 데이터 타입은 ndarray. 이 ndarray를 이용하여 다차원 배열을 쉽게 생성하고, 다양한 연산을 수행. 이러한 ndarray는 넘파이의 array()함수를 이용하여 생성함. 생성된 ndarray배열의 shape변수는 ndarray의 크기(행과 열의수)를 튜플 형태로 가지고있으며 이를 통해 ndarray배열의 차원을 확인할 수 있다. ndarray.shape는 ndarray의 차원과 크기를 튜플형태로 나타내준다. → 쉽게 생각하면, 리스트 한개로 구성되어 있으면 1차원, 리스트..

DeepLabV3plus

2023.10.26· ML & DL/Computer vision

semantic segmentation을 해결하기 위해 다양한 방법론이 나왔는데, deeplab시리지는 여러 모델중 상위권에 속한다. DeepLab V1 : Atrous convolution을 처음 적용 DeepLab V2 : multi-scale context를 적용하기 위한 Atrous Spatial Pyramid Pooling (ASPP) 기법을 제안 DeepLab V3 : 기존 ResNet 구조에 Atrous Convolution을 활용해 좀 더 Dense한 feature map을 얻는 방법을 제안 DeepLab V3+ : Depthwise Separable Convolution과 Atrous Convolution을 결합한 Atrous Separable Convolution의 활용을 제안 그 중 ..

U-Net

2023.10.26· ML & DL/Computer vision

1. U-Net U-net은 본래 의학 이미지 segmentation을 목적으로 나온 모델이다. 의학 이미지 특성상 이미지가 매우 적었고 이러한 매우 적은 수의 학습 데이터로도 정확한 이미지 세그멘테이션 성능을 보여줬다. U-net은 Fully Convolution Network(FCN)을 기반으로 구축하였으며 인코더-디코더 기반의 모델로, 인코딩 단계에서 입력 이미지의 특징을 포착할 수 있도록 채널의 수를 늘리면서 차원을 축소해 나가고, 디코딩 단계에서 저 차원으로 인코딩 된 정보를 이용하여 채널의 수를 줄이고 차원을 늘려서 고차원의 이미지를 복원한다. 1-1. Skip connection 일반적인 segmentation 모델의 인코더는 차원 축소를 거치면서 객체에 대한 위치 정보를 잃고, 디코딩 단계..

Image segmentation(recognition+localization)

2023.10.26· ML & DL/Computer vision

0. Image segmentation Image segmentation은 object의 boundary를 참조하여, 해당 객체가 있는 위치를 정확히 가리키는 역할을 한다. 대부분의 image segmentation 모델은 encoder, decoder구조로 구성되어 있다. Encoder: input의 latent space representation을 인코딩 Decoder: encoder로부터 encoding된 정보로부터 decoding하고 segment map을 형성 Image segmentation은 크게 3가지로 나뉜다. 1. Semantic segmentation Image의 pixel을 semantic(의미론적)으로 분류하는 것. == 실제로 인식할 수 있는 물리적 의미 단위로 인식하는 세그멘..

EfficientDet

2023.10.26· ML & DL/Computer vision

모델의 아키텍쳐를 구성할 때 얼마나 많은 layer(depth), 얼마나 많은 픽셀 resolution. 얼마나 많은 filter을 사용할지를 찾아주는 Compound scaling을 방식을 사용 → 모델의 크기와 연산량를 결정하는 요소들(input resolution, depth, width)을 동시에 고려하여 증가시키는 방법. EfficientNet이 제안했고 이 EficientNet을 backbone으로 사용한 모델이 EfficientDet이다. EfficientNet의 compound scaling에 대하여 간단하게 설명하면, Width와 resolution은 연산량에 거듭제곱형태로 연산량이 늘고, depth는 linear 하게 늘어나기 때문에, 같은 연산량에서 scaling을 해보기 위해, 아래..

YOLO: You Only Look Once

2023.10.26· ML & DL/Computer vision

0. YOLO SSD 이전에 나온 1-stage detector로 unified, simple, real-time object detection이라고 부르기도 한다. YOLO의 특징은 이미지 전체를 한 번만 보고, 통합된 네트워크를 사용하여 간편하고 빠르며 거의 실시간 객체 검출이 가능하다. 1. Grid Image YOLO는 우선 이미지를 SxS 크기의 grid로 나눈다. 다음으로 객체의 중심이 특정 grid cell에 위치한다면, 해당 grid cell은 그 객체를 detect 하도록 할당된다. 이 선택된 셀은 Bounding Box와 Confidence, Class probability map을 예측하는데 사용된다. 2. Backbone 앞서 하나의 이미지를 SxS의 그리드로 나눈뒤 해당 이미지는 ..

티스토리툴바