Normal Distribution 정규 분포
1. 정규 분포 또는 가우시안 분포 ㅇ 자연과학,공학의 통계적 방법에서 가장 많이 이용되는 대표적 확률분포 - 오차들의 분포 등 많은 자연현상을 매우 잘 표현하는 이상적인 수학적 확률모형 - 일상생활의 키,몸무게,제품수명 등의 자료분포가 정규분포에 매우 근사적으로 접근 ㅇ 평균을 중심으로 좌우대칭인 종(鐘,bell) 모양을 갖는 확률 분포 2. 용어 명칭 ㅇ 공학자는 `가우시안 분포`라고 하며, 수학자는 `정규 분포`라고 말함 - 1809년 독일수학자 가우스가 천체 위치의 측정 오차 분포를 이것으로 설명 ㅇ 기타 많은 수학자가, 종 모양(bell-shaped)의 거의 모든 분포가 가우스 분포를 가 지며, 이것을 정규 분포(normal distribution)라고 부름 3. 정규분포 모양/형태/특징 ㅇ `평균`, `분산` 2개 만의 변수로 설명이 가능 - X ~ N(μ,σ²) - 정규분포 곡선은 분포 중심인 평균, 분포 폭인 분산(또는 표준편차 σ)에 의해 결정 ㅇ 확률밀도함수는 종형(bell-shape) 모양의 대칭적 분포를 가짐 - 평균값 μ을 중심으로 좌우대칭, 가운데에 위치한 값이 최대값 - 정규분포를 따르는 데이터는 전체의 99.7%가 평균으로부터 ±3σ 범위내에 존재 ㅇ 분산이 같으면 평균이 변하더라도 분포의 모양이 변하지 않음 - 분산값이 클수록 굵고 평평한 종모양 형태이며, 작을수록 가늘고 뾰족한 형태4. 정규분포 주요 특성 ㅇ 표기 : X ~ N(μ,σ²) - 두 개의 모수 μ(평균),σ²(분산)에 의해 결정되는 확률적 분포 ㅇ 확률밀도함수 (Probability Density Function, PDF)
ㅇ 평균(기대값) : E[X] = μ ㅇ 분산(Variance) : Var[X] = σ²
Standard Normal Distribution 표준 정규분포
1. 표준 정규분포 (Standard Normal Distribution) ㅇ 다양한 종(Bell) 모양의 정규분포를 평균이 0 이고 표준편차가 1 로 규격화시킨 것 2. 표준 정규분포로의 변환 ㅇ 정규분포(가우시안 분포)의 불편함 - 평균 및 표준편차 값에 따라 중심 위치 및 전체 모양이 달라짐 . 2 이상의 정규분포를 서로 비교할 때 또는 확률값 계산할 때에 매우 불편 ㅇ 따라서, 모든 정규분포를 다음과 같이 표준적인 정규분포로 변환하여 사용이 바람직 - 즉, 평균이 0 이고, 표준편차가 1로 변환된 정규화된 분포 => 표준정규분포 . 어떤 관찰값이 평균으로부터 표준편차의 몇 배 만큼 떨어져 있는가의 척도
'BigData > 수학이론' 카테고리의 다른 글
확률분포 > 포아송분포 (0) | 2015.03.17 |
---|---|
확률분포 > 지수분포 (0) | 2015.03.17 |
확률분포 > 균등분포 (0) | 2015.03.17 |
거리(distance) 구하기 (0) | 2015.03.16 |