k-means2 데이터 리터러시 #4 데이터 과학자의 가설 사고 4장을 읽고 정리해 본 내용이다. 3장에서 데이터 비교는 Apple to Apple 처럼 비슷한 분류의 데이터 사이에 이뤄져야 한다고 언급했다. 그렇다면 비슷한 데이터들끼리 분류가 필요하다. 4장에서는 데이터를 어떻게 분류하고 그룹핑하는지 소개하고 있다.특징이 비슷한 데이터로 그룹을 만드는 방법목적에 따라 데이터를 분류하는 일의 중요성데이터를 기계적으로 분류하는 방법데이터를 분류하는 순서특징이 비슷한 데이터를 그룹화하자. 어느 카페에서 커피와 디저트 주문 횟수를 시각화 한 사례이다. 대략 손님을 그룹핑하면 우측 그림처럼 될 것이다. (책에는 3가지 선택지를 가진 퀴즈로 소개하는데, 간단한 부분이라 생략하고 정답만 소개한다) 그룹1, 2, 3으로 나눠진 기준은 무엇일까?그룹1.. 2024. 4. 27. [elice]KAIST 주관 2016년 머신러닝 워크샵 후기 2016년 8/22 ~ 23일 2일간 진행되는 머신러닝 워크샵을 다녀왔습니다. 평소에 머신러닝에 관심이 많이 혼자 공부를 하였었는데, 아무래도 혼자하다보니 이론적 기초에 부족함을 많이 느꼈습니다. 그러던 중 카이스트에서 주관하는 elice 머신러닝 워크샵이라는 좋은 기회가 있어 참석하게 되었습니다. 기존에는 온라인으로만 진행하던 워크샵이 이번해에는 오프라인 워크샵도 추가되어 진행되었습니다. 주로 실습위주로 진행되었으며, 2일간 1시간씩 기초 이론강의가 진행되었습니다. 주제는 아래와 같습니다. Day 1 : Introduction to Machin Learning, Regression, and Classification Day 2 : Dimension Reduction, Clustering, Introdu.. 2016. 8. 24. 이전 1 다음