우선 인공지능, 머신러닝, 딥러닝에 대하여 차이점은 간단하게 아래 사진을 통해서 확인할 수 있다.
이번 글에서는 딥러닝에 대한 전체적인 개요에 대해서 작성해볼 것이다.
이러한 딥러닝의 성능은 아래의 모델 + 데이터 + 학습방법(손실함수,최적화알고리즘,규제)등에 의해 결정된다.
딥러닝을 구성하는 필수적인 요소로는 다양한 것들이 존재한다.
1. 모델을 학습하기 위해 필요한 데이터 -> MNIST, Fashion MNIST ..
2. 주어진 데이터를 원하는 결과로 변환하는 모델 -> MLP, CNN, RNN..
3. 모델의 결과에 대한 오차를 수치화하는 손실함수 -> MAE, MSE ..
4. 손실함수의 값이 최소가 되도록 모델의 파라미터를 조정하는 최적화 알고리즘 -> Gradient descent, Momentum
5. 성능 향상을 위한 기타 알고리즘/규제 -> Dropout, Normalization
1. 데이터
데이터는 풀고자하는 task에 따라 달라지게된다. 예를 들어 어떠한 물체가 존재하는 지를 확인하는 task라고 하면, 데이터로는 물체가 존재하는 이미지, 존재하지 않는 이미지, 위치를 표시하는 라벨 등이 존재해야 한다.
자연어 처리 문제의 경우 대량의 corpus 등이 해당된다.
2. 모델
모델의 경우는 입력이 들어오면 출력을 하는 연산과정을 구조화 한 것을 의미하며, 딥러닝의 학습 대상이다.
3. 손실함수
손실함수는 target($ y $)값과 예측값($ \hat{y} $) 사이의 차이, 오차를 수치화 하는 함수이다.
4. 최적화 알고리즘
손실함수가 최소가 되게끔, 즉 실제값과 예측값 사이의 오차가 최소가 되게끔 모델의 파라미터를 최적화하는 알고리즘. 파라미터는 함소의 성질이나 모델의 성질을 나타내는 모델의 식을 이루는 값이다.
딥러닝 파이프라인
결과적으로 딥러닝은 목적 task에 알맞는 데이터를 수집한 후 모델이 데이터를 이용하여 학습하는 과정일 거치는데 이 학습 과정에서 모델이 예측한 값의 차이가 적어지도록 즉 손실함수의 값이 최소가 되도록 최적화 알고리즘을 이용하여 모델의 파라미터를 찾는 과정이다.
'ML & DL > 개념정리' 카테고리의 다른 글
Gradient Descent: 경사하강법 (1) | 2023.12.20 |
---|---|
퍼셉트론과 다층 퍼셉트론(MLP) (0) | 2023.12.19 |
딥러닝 기술 분류 (1) | 2023.12.19 |
딥러닝 발전 단계 (0) | 2023.12.19 |
Decision Tree:의사결정나무 (0) | 2023.12.13 |