kNN(k-Nearest Neighbors) 기계학습

less than 1 minute read

#kNN(k-Nearest Neighbors) kNN알고리즘은 지도학습의 한 종류로서 새로운 데이터를 입력 받았을 때 가장 최근접이 무엇이냐를 중심으로 새로운 데이터의 종류를 정해주는 알고리즘입니다.

KNN

쉽게 말하면 물음표의 주변에 있는 것이 세모이기 때문에 세모라고 판단하는 알고리즘 입니다.

KNN1

하지만 위와 같은 그림에선 물음표에서 가장 가까운것은 파란 동그라미인데, 조금더 생각을 해보면 뭔가 부적절하다는 생각이 듭니다. 그래서 단순히 주변에 무엇이 가장 가까이 있는가를 보는 것이 아니라, 주변에 있는 몇개의 것들을 같이 봐서 가장 많은것을 골라내는 방식을 사용하게됩니다. KNN에서 K는 주변의 개수를 의미하는데, K가 1일때는 물음표를 파란동그라미라고 판단하겟지만, K가 4이면 빨간 세모로 판단할 것입니다.

ED

최근접 이웃을 찾기 위해 유클리드(Euclidean distance)거리가 사용되며, 가장 가까운 거리일수록, 가장 유사한 범주에 속한다고 할 수 있습니다.

kNN기계학습은

-개인별 영화 추천

-이미지/비디오에서 얼굴과 글자 인식

-유전자 데이터 패턴 인식(종양 식별) 등에서 적용되고 있습니다.