티스토리 뷰

BigData/수학이론

거리(distance) 구하기

Tomining 2015. 3. 16. 12:28

네이버 블로그에서 퍼 온 글입니다.


유클리드 거리 (Euclidean distance)

 

 

 

 

 

 

표준화 거리 (statistical distance)

   ,   D = 

 

 


마할라노비스 (Mahalanobis) 거리 

    ,    S = 




체비셰프 (Chebychev) 거리 


 

 

맨하탄 (Manhattan) 거리 

맨하탄 거리는 바둑판 처럼 가로,세로 길이를 더한 것이라 한다.  ("데이터마이닝", 방통대)
직선길이가 아닌

 

 

캔버라 (Canberra) 거리




 

민코우스키 (Minkowski) 거리

 



 

 

 









 

 

 

 

 

여기서부터는 유명한 거리들 몇 개에 대한 설명















 

마할라노비스 거리는 분산을 고려한 거리이다.

왜 분산을 고려하냐면 , 분산이 클 경우 점들이 더 멀리 퍼져있을 거란 가정 때문이다.

 

위의 오른쪽 그림에서

분산을 고려하지 않을 경우 점1 과 점2의 거리(유클리디안 거리)는 같지만,

분산을 고려할 경우 점1이 점2보다 멀리 있다. 왜냐하면 점1의 축의 분산이 점2 축의 분산보다 작기 때문이다.

 

 

http://blog.naver.com/wjddudwo209/220013635050





















 



'BigData > 수학이론' 카테고리의 다른 글

확률분포 > 포아송분포  (0) 2015.03.17
확률분포 > 지수분포  (0) 2015.03.17
확률분포 > 균등분포  (0) 2015.03.17
확률분포 > 정규분포  (0) 2015.03.17
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함