KNeighbors Classifier (K - 최근접 이웃 분류 모델)

새로운 데이터를 분류할 때 가장 가까운 데이터 포인터들을 기반으로 결정을 내립니다.

즉, 새로운 데이터가 주어지면, 그 데이터가 속할 카테고리를 주변 이웃 데이터들과의 거리를 보고 결정합니다.


동작 원리

근처 이웃의 수를 결정해야 합니다. 예를 들어 k = 5라면 5 개의 이웃을 찾아 그들의 분류 결과에 따라 새로운 데이터를 분류합니다.(아래 사진 참조)

거리 계산 : 유클리드 거리 공식을 사용합니다.

유클리드 거리 공식

이 계산을 통해 가장 가까운 이웃 k개를 선택합니다.

 

그 이웃들의 카테고리가 많은 쪽이 새로운 데이터의 카테고리가 됩니다.


K-최근접 이웃 분류 모델 장단점

KNN은 매우 간단하나, 정확도가 떨어지는 편입니다.


참고 그림

참고하세요~


이번 글은 KNN의 기본 개념과 동작원리, 장단점에 대해 알아보았습니다.

다음 글은 python을 통해 KNN 모델을 사용하고 정확도를 평가해보겠습니다.

이상입니다.

728x90
hmm06