Computer vision Metric

2024. 2. 23. 17:15·ML & DL/Computer vision

1. Image Classification

1-1. Confusion Matrix

이전에 분류지표에서도 많이 설명했던 Confusion Matrix에 대하여 다시 짚고 넘어가자.

`TP`: 실제 positive인 것을 positive라고 예측 =정답

`FP`: 실제 negative인 것을 positive로 예측= 오답

`FN`: 실제 positive인 것을 negative로 예측 = 오답

`TN`: 실제 negative인 것을 negative로 예측 = 정답

1-2. 평가지표

즉 앞에 T/F는 맞혔는지 틀렸는지를 의미, 뒤에 P/N은 무엇으로 예측하였는지를 의미

`Accuracy`: 전체 데이터에 대하여 올바르게 예측된 데이터의 비율 $$ \text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN} $$

`Precision`: 모델이 positive로 예측한 데이터 중에서 실제 positive인 데이터의 비율 $$ \text{Precision} = \frac{TP}{TP + FP} $$
`Recall`: 실제 positive인 데이터 중에서 모델이 positive로 예측한 데이터의 비율 $$\text{Recall (Sensitivity)} = \frac{TP}{TP + FN} $$
`Specificity`: 실제 negative인 데이터 중에서 모델이 negative로 예측한 데이터의 비율 $$\text{Specificity} = \frac{TN}{TN + FP} $$
`F1 score`:Precision과 recall의 조화평균 $$ F1 score = \frac{2 \times \text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}$$

`TPR`: 실제 True 중에서 positive로 예측한 비율

`FPR`: 실제 False 중에서 positive로 예측한 비율

1-3. ROC curve

다양한 threshhold에서의 성능을 한눈에 볼 수 있도록 시각화 한 측정 그래프 

FPR과 TPR을 각각 x, y축으로 가지는 그래프로, threshold를 연속적으로 바꾸면서 측정했을 때 이 둘의 변화를 나타낸 것

좌상단에 치우칠수록 높은 성능을 의미한다. 

 

2. Object Detection

2-1. IoU

`IoU`: Intersection over Union의 약자로, Bounding Box의 겹치는 영역의 크기를 통해 정확도를 평가하는 방법

2-2. TP & FP

위의 classification의 confusion matrix에서 나왔던 TP와 FP를 Object Detection에서는 IoU값을 기준으로 분류한다. 

특정 threshold를 기준으로 IoU가 threshold보다 클 경우 TP로 구분, 작을 경우 FP로 구분한다. 

이를 이용해 Precision과 Recall을 계산할 수 있다. 

Threshold가 높을수록, bbox의 수가 적어지고 Recall이 내려가며 Precision이 올라간다.

Threshold가 낮을수록, bbox의 수가 많아지고 Recall이 높아지며 Precision이 내려간다.

이 관계를 그래프로 그린 것이 `PR Curve`라고 부른다. 

이렇게 구한 PR Curve의 아래쪽 면적을 `AP`:Average Precision이라고 부르며 모델의 성능을 정략적으로 평가하고자 하는 수치이다. 모든 클래스에 대한 AP의 평균을 `mAP`: Mean Average Precision이라고 부른다. 

3. Image Segmentation

3-1. PA

`PA`:Pixel Accuracy는 모든 pixel에 대해 class를 올바르게 예측한 pixel의 비율을 의미한다. 

$$ PA=\frac{\sum_{i=0}^{K}p_{ii}}{\sum_{i=0}^{K}\sum_{j=0}^{K}p_{ij}} $$

이를 모든 class에 대하여 평균을 내면 `MPA`:Mean Pixel Accuracy라고 부른다.

$$ MPA=\frac{1}{K+1}\sum_{i=0}^{K}\frac{p_{ii}}{\sum_{j=0}^{K}p_{ij}} $$

3-2. IoU

Object Detection에서는 bbox의 겹치는 것을 기준으로 평가했다면, Image Segmentation에서는 픽셀단위의 겹치는 부분을 이용하여 계산한다. 

3-3. Dice Coefficient

IoU와 유사하지만, 두 영역(합집합, 교집합)의 조화평균을 사용하여 계산하는 방법

- 데이터가 imbalence 할 경우 더 정확한 metric

728x90

'ML & DL > Computer vision' 카테고리의 다른 글

ViT: Vision Transformer  (0) 2024.02.26
Transformer  (0) 2024.02.24
FCN: Fully Convolutional Network  (0) 2024.02.02
Semantic segmentation 방식  (0) 2024.02.02
EfficientNet  (0) 2024.01.30
'ML & DL/Computer vision' 카테고리의 다른 글
  • ViT: Vision Transformer
  • Transformer
  • FCN: Fully Convolutional Network
  • Semantic segmentation 방식
창빵맨
창빵맨
  • 창빵맨
    Let's be Developers
    창빵맨
    로그인/로그아웃
  • 전체
    오늘
    어제
    • 분류 전체보기 (471)
      • 알쓸신잡 (79)
      • ML & DL (85)
        • Computer v.. (22)
        • NLP (22)
        • 파이썬 머신러닝 완.. (3)
        • 개념정리 (38)
      • 리눅스 (21)
      • 프로젝트 (29)
        • 산불 발생 예측 (6)
        • 음성비서 (12)
        • pdf 병합 프로그.. (0)
        • 수위 예측 (5)
        • 가짜 뉴스 분류 (5)
        • 전력사용량 예측 (1)
      • 코딩테스트 (217)
        • 프로그래머스[Pyt.. (17)
        • 프로그래머스[Fai.. (3)
        • 백준[Python] (160)
        • 이것이취업을위한코딩.. (18)
        • 파이썬 알고리즘 (19)
      • 데이터분석실습 (25)
        • 데이터 과학 기반의.. (18)
        • 헬로 데이터 과학 (7)
      • 메모장 (0)
      • 잡담 (4)
  • Personal

    GITHUB
    Instagram
  • 공지사항

  • 인기 글

  • 태그

    그리디
    나동빈
    이코테
    이것이취업을위한코딩테스트다
    이분탐색
    백준
    BFS
    파이썬
    dp
    DFS
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3

HOME

HOME

상단으로

티스토리툴바