딥러닝은 AI/ML/DL 관점에서 크게 5단계로 개발 방법론이 진화하였다.
1. Rule based programming
1단계는 Rule based programming 이다. 어떠한 과정을 거쳐야 output이 나오는지를 인간이 전부 정해줘야하는, 모든 연산을 설계한다. 즉 데이터와 알고리즘을 주고 계산하는 것을 의미한다.
2. Conventional machine learning
2단게는 1단계와 동일한 방식으로 사람이 어떠한 특징을 봐야하는지 등은 정해줘야 하지만 그러한 특징(hand designed feature)을 가지고 output을 내는 것은 machine learning의 연산을 통해 나오게 된다. 이 machine learning은 학습데이터 준비 ->모델 학습 과정을 거친다. 즉 데이터와 결과값을 주면 머신러닝이 계산해주는 것을 의미한다.
3. Deep Learning
이전 단계에서는 특징을 찾아주면 그 특징들의 관계를 머신러닝이 계산해줬는데, 딥러닝의 경우는 이런 feature들도 모델이 정하고, 그 특징들의 관계까지 찾아내는 것을 말한다. 매우 다양한 연산들이 이뤄지며,큰 틀(백본)을 이용하여 모델을 구성한다.
4. Pre-training & Fine tuning
pretraining을 이용하여 특징추출에 해당하는 부분을 학습한 이후, fine tuning과정을 통해 해당 특징이 어떤 특징을 가질 때 결과값이 바뀌는지에 대한 것만 학습.
컴퓨터 비전
컴퓨터 비전에서는 다양한 이미지를 사용하여 특징을 추출하는 모델을 먼저 만든다음, 해당 모델의 특징 추출기만 가져와서 내가 원하는 이미지를 분류하도록 라벨링된 정답을 넣어주고 학습시킨다.
자연어 처리
자연어처리에서는 입력 텍스트에서 우리가 직접 라벨링을 해주는 것이 아니라 모델이 직접 정답을 만들어내는 unsupervised=self supervised learning이 이뤄졌다. 텍스트 하나만 넣어주면 각 텍스트에서 이 단어 다음에 어떤 단어가 올지에 대한 task를 목표로 데이터를 만들게 된다. 이를 통해 언어의 일반적인 특징을 학습했다고 생각하고 이 학습된 pretrained 모델을 가져와 특징 추출에 해당하는 부분은 frozen 시키고, 이 특징이 긍정인지 부정인지를 해당하는 것은 라벨링을 진행하는 fine tuning 작업을 진행한다. 이는 pretrain을 할 때 사람이 개입되지 않기 때문에 데이터를 매우 많이 학습하여 점점 언어의 특징을 학습하고 이 거대 언어 모델을 fine tuning을 하여 다양한 task를 진행한다.
5. Big Model & zero/few shot
5단계에서는 in-context learning이라는 것이 나왔는데, 이는 태스크별로 별도 모델이 필요없으며 각 태스크에 맞는 데이터 데이터도 모을 필요없다는 것을 말한다. 이게 무슨 말이냐 하면 pretrained model에 입력 input을 넣어줄 때, 어떤 task를 진행할지를 설명해주니까 해당 pretrained model이 알맞는 output을 내줬다. 이는 fine tuning을 하지 않은 기존 pretrained model에 진행한 결과이다. 이는 GPT-3에서 모델 파라미터 개수가 175B가 넘으니까 fine tuning을 한 모델보다 더 성능이 높게 나왔다는 결과를 발표함에 입증되었다.
'ML & DL > 개념정리' 카테고리의 다른 글
딥러닝 개요 (0) | 2023.12.19 |
---|---|
딥러닝 기술 분류 (1) | 2023.12.19 |
Decision Tree:의사결정나무 (0) | 2023.12.13 |
분류와 회귀 (0) | 2023.12.11 |
Evaluation metric (평가 지표) (1) | 2023.12.11 |