네이버 블로그에서 퍼 온 글입니다.
유클리드 거리 (Euclidean distance)
표준화 거리 (statistical distance)
, D =
마할라노비스 (Mahalanobis) 거리
, S =
체비셰프 (Chebychev) 거리
맨하탄 (Manhattan) 거리
맨하탄 거리는 바둑판 처럼 가로,세로 길이를 더한 것이라 한다. ("데이터마이닝", 방통대)
직선길이가 아닌
캔버라 (Canberra) 거리
민코우스키 (Minkowski) 거리
여기서부터는 유명한 거리들 몇 개에 대한 설명
마할라노비스 거리는 분산을 고려한 거리이다.
왜 분산을 고려하냐면 , 분산이 클 경우 점들이 더 멀리 퍼져있을 거란 가정 때문이다.
위의 오른쪽 그림에서
분산을 고려하지 않을 경우 점1 과 점2의 거리(유클리디안 거리)는 같지만,
분산을 고려할 경우 점1이 점2보다 멀리 있다. 왜냐하면 점1의 축의 분산이 점2 축의 분산보다 작기 때문이다.
http://blog.naver.com/wjddudwo209/220013635050
[출처] 거리 (distance)|작성자 오늘도기쁜하루
'BigData > 수학이론' 카테고리의 다른 글
확률분포 > 포아송분포 (0) | 2015.03.17 |
---|---|
확률분포 > 지수분포 (0) | 2015.03.17 |
확률분포 > 균등분포 (0) | 2015.03.17 |
확률분포 > 정규분포 (0) | 2015.03.17 |