표본분포
표본(sample) : 여러 통계 자료를 포함하는 집단 속에서 그 일부를 끄집어내어 조사한 결과로 원래의 집단의 성질을 추측할 수 있는 통계 자료. 샘플 (by 구글 사전) 데이터를 분석할 때 '빅데이터'라는 말처럼 데이터의 양은 굉장히 중요하다. 하지만 무조건 많다고 좋은 결과를 얻을 수 있는 것은 아니다. 그 예로 1936년 미국 대선 때 있었던 설문 조사를 볼 수 있다. 당시 1,000만 명이 넘는 사람들 대상으로 한 설문조사보다 2,000명을 대상으로 한 설문조사의 예측이 더 정확했다. (1,000만 명은 예측을 실패했고 2,000명은 성공했다.) 이렇듯 데이터의 질도 굉장히 중요하고, 여기서 표본의 중요도도 높아진다. 표본을 측정할 때 편향되지 않도록 하는 것이 굉장히 중요하다. 편향(bias)..