데이터마이닝2 데이터 마이닝 Study 로드맵 페이스북 통계마당 그룹에서 어떤 분이 올려주신 공부 로드맵이다.평소에 데이터마이닝 쪽에 관심이 많아서 혼자 공부하던 중에 도움이 될 것 같아서 복사해 두었다. 내용만 복사 해 두어서 어떤 분이 작성했는지는 기억이 나질 않는다. 그 분께 감사하다고 이야기 하고 싶다. # 데이터마이닝 공부 로드맵 for 파이썬제목과 관련하여 얼마전에 정리한 내용이 있어 공유 드립니다. 제가 공부한 과정이기도 하고, 제가 운영하는 연구실의 코스웤이기도 합니다. 현재 학교에서도 이 코스로 MOOC 강좌를 개발하고 있습니다... 언제 끝날지는 ㅎㅎ 필요하신 분께 도움이 되었으면 합니다.1) 리눅스 공부: 데이터 분석을 위해서는 리눅스와 command line interface(CLI)에 익숙해 져야 합니다. 리눅스 공부를 먼저 .. 2016. 1. 20. 거리(distance) 구하기 네이버 블로그에서 퍼 온 글입니다. 유클리드 거리 (Euclidean distance) 표준화 거리 (statistical distance) , D = 마할라노비스 (Mahalanobis) 거리 , S = 체비셰프 (Chebychev) 거리 맨하탄 (Manhattan) 거리 맨하탄 거리는 바둑판 처럼 가로,세로 길이를 더한 것이라 한다. ("데이터마이닝", 방통대) 직선길이가 아닌 캔버라 (Canberra) 거리 민코우스키 (Minkowski) 거리 여기서부터는 유명한 거리들 몇 개에 대한 설명 마할라노비스 거리는 분산을 고려한 거리이다.왜 분산을 고려하냐면 , 분산이 클 경우 점들이 더 멀리 퍼져있을 거란 가정 때문이다. 위의 오른쪽 그림에서분산을 고려하지 않을 경우 점1 과 점2의 거리(유클리디안 거.. 2015. 3. 16. 이전 1 다음