BigData66 거리(distance) 구하기 네이버 블로그에서 퍼 온 글입니다. 유클리드 거리 (Euclidean distance) 표준화 거리 (statistical distance) , D = 마할라노비스 (Mahalanobis) 거리 , S = 체비셰프 (Chebychev) 거리 맨하탄 (Manhattan) 거리 맨하탄 거리는 바둑판 처럼 가로,세로 길이를 더한 것이라 한다. ("데이터마이닝", 방통대) 직선길이가 아닌 캔버라 (Canberra) 거리 민코우스키 (Minkowski) 거리 여기서부터는 유명한 거리들 몇 개에 대한 설명 마할라노비스 거리는 분산을 고려한 거리이다.왜 분산을 고려하냐면 , 분산이 클 경우 점들이 더 멀리 퍼져있을 거란 가정 때문이다. 위의 오른쪽 그림에서분산을 고려하지 않을 경우 점1 과 점2의 거리(유클리디안 거.. 2015. 3. 16. The Data Engineering Ecosystem: An Interactive Map http://insightdataengineering.com/blog/The-Data-Engineering-Ecosystem-An-Interactive-Map.html 데이터 수집, 배치 처리, 스트림 처리, 프론트 엔드까지 각 영역별로 어떤 대안들이 있는지 한눈에 들어오도록 잘 정리한 맵입니다. http://insightdataengineering.com/blog/pipeline_map.html 에서 각 카테고리별로 간단한 설명을 확인할 수 있습니다.(카테고리들에 마우스를 가져가 보세요.) 아래 내용은 위 URL 내용을 번역한 내용입니다. Companies, non-profit organizations, and governments are all starting to realize the huge va.. 2015. 3. 12. Capitalizing on Asia’s digital-banking boom http://www.mckinsey.com/insights/financial_services/Capitalizing_on_Asias_digital-banking_boom?cid=other-eml-alt-mip-mck-oth-1503%EF%BB%BF 맥킨지 컨설던트 Sonia Barquin 이 쓴 아시아에서의 FinTech 붐에 관련된 글이다. 2011년, 2014년 16000명에게 설문조사한 내용을 기반으로 하고 있는데. 관련이미지를 보면 2011년에서 2014년으로 가면서 Smart Phone 뱅킹 사용률 Developed Asia, Emerging Asia 각각 3.2배, 5.2배 증가했다. 엄청난 증가세다... 과연 FinTech 붐이라고 할 만 하다. 그래서 국내업체들이 FinTech에 열을 올리.. 2015. 3. 6. Apache Spark 1.2.0은 Netty기반과 고가용성, 머신러닝 API를 지원한다. http://www.infoq.com/news/2015/01/Apache-Spark-1.2.0-Released아래 내용은 위 원문 기사를 번역한 내용이다. Apache Spark 1.2.0은 Netty기반과 고가용성, 머신러닝 API를 지원한다. Apache Spark 1.2.0 was released with major performance and usability improvements in the Spark core engine. It represents the work of 172 contributors from over 60 institutions and comprises more than 1000 patches.아파치 스파크 코어엔진 성능과 가용성이 향상된 1.2.0 버전이 릴리즈 되었다. 6.. 2015. 3. 6. 이전 1 ··· 12 13 14 15 16 17 다음