네이버 블로그에서 퍼 온 글입니다.
유클리드 거리 (Euclidean distance)
표준화 거리 (statistical distance)
마할라노비스 (Mahalanobis) 거리
체비셰프 (Chebychev) 거리
맨하탄 (Manhattan) 거리
맨하탄 거리는 바둑판 처럼 가로,세로 길이를 더한 것이라 한다. ("데이터마이닝", 방통대)
직선길이가 아닌
캔버라 (Canberra) 거리
민코우스키 (Minkowski) 거리
여기서부터는 유명한 거리들 몇 개에 대한 설명
마할라노비스 거리는 분산을 고려한 거리이다.
왜 분산을 고려하냐면 , 분산이 클 경우 점들이 더 멀리 퍼져있을 거란 가정 때문이다.
위의 오른쪽 그림에서
분산을 고려하지 않을 경우 점1 과 점2의 거리(유클리디안 거리)는 같지만,
분산을 고려할 경우 점1이 점2보다 멀리 있다. 왜냐하면 점1의 축의 분산이 점2 축의 분산보다 작기 때문이다.
http://blog.naver.com/wjddudwo209/220013635050
[출처] 거리 (distance)|작성자 오늘도기쁜하루
'BigData > 수학이론' 카테고리의 다른 글
확률분포 > 포아송분포 (0) | 2015.03.17 |
---|---|
확률분포 > 지수분포 (0) | 2015.03.17 |
확률분포 > 균등분포 (0) | 2015.03.17 |
확률분포 > 정규분포 (0) | 2015.03.17 |