ML & DL/Computer vision

주어진 task에 가장 최적인 네트워크 구조를 편리하고 빠르게 탐색하는 방법론 Search space(탐색 범위) Search space는 알고리즘이 탐색을 수행하는 공간. 이 탐색공간에는 candidate operation (convolution, fully-connected, pooling, etc.)의 집합과 그 operation들이 어떻게 연결 되는지, 그리고 총 몇개의 operation이 모여 네트워크를 구성하는지가 정의된다. 그렇기 때문에 이 공간의 모든 원소는 각각 하나의 유효한 네트워크 구조 (valid network configuration)를 나타낸다고 할 수 있겠다 Search Strategy는 Search space에 있는 요소들로부터 후보 아키텍처를 선정함 Search Strate..
0. ResNet ResNet이전에 나온 VGGNet 등에서 모델이 깊어질수록성능에 큰 영향을 준다는 것은 알려졌었지만 단순 layer가 깊어질수록 성능이 증가하는 것이 아니었고 gradient vanishing, exploding 등의 문제로 인해 성능이 오히려 떨어지는 현상들이 발견됐다. gradient vanishing이란 layer가 깊어질수록 미분을 점점 많이 하기 때문에 backpropagation을 해도 앞의 layer일수록 미분값이 작아져 그만큼 output에 영향을 끼치는 weight 정도가 작아지는 것을 말한다. 이는 overfitting과는 다른 문제인데, overfitting은 학습 데이터에 완벽하게 fitting 된 것으로 train set에서는 성능이 좋고, 테스트에서 떨어지게 ..
0. Computer vision task Computer vision task에는 아래와 같이 다양한 task들이 있다. Classification: 한 이미지가 있을 때, 그 이미지의 클래스를 분류 Object detection: 한 이미지에서 각 객체의 클래스가 무엇이고, 그 객체의 박스형 위치 탐지 Segmentation: 한 이미지에서 각 객체의 클래스가 무엇인지, 그 객체의 픽셀 단위 위치 탐지 1. Object Detection 이번 글에서는 Object Detection의 개요에 대하여 설명해보고자 한다. Object Detection이란, 다수의 사물이 존재하는 이미지, 비디오 등에서 각 사물의 위치(bounding box)와 클래스를 찾는 task. (여기서 Bounding box란 위..
창빵맨
'ML & DL/Computer vision' 카테고리의 글 목록 (4 Page)