[모델 평가] Confusion matrix (TP, TN, FP, FN) 및 단일/다중 클래스 평가 방법 (1)
본 포스팅에서는 단일 및 다중 분류 모델에서, 모델의 성능을 평가하기 위한 다양한 performance measures 에 대하여 포스팅한다. 1. 목적 분류 모델을 평가 하기 위해서는 다양한 평가 기준들이 존재한다. 대표적으로, 정말 간단하게는 정확도 또는 오차율 등으로 분류 성능을 테스트하게 되지만, 이러한 단순한 방법으로 performance 를 표현하는 것은 분류 모델의 신뢰성을 떨어뜨린다. 논문이나 질병 관련 자료 등을 보면, Performance measures에는 정말 다양한 측정 방법들이 있고, 관련 분야에 종사하는 분들은 모두 한 번씩 들어봤을 익숙한 키워드들이다. - 특이도 (specificity), 민감도 (sensitivity), FPR (false positive rate), +P..