기초 통계(2) 평균(mean), 분산(variance), 공분산(Covariance)
수집한 데이터로 계산을 수행하여 얻은 값을 '통계량'이라고 하고, 이러한 통계량을 통해 대상을 이해하는 과정이 데이터 분석이다. 데이터에서 몇 가지 통계량을 계산하여 요약하면, 데이터가 어떻게 형성되어 있는지 특징짓는 일이 가능해지는데, 이를 기술 통계량 또는 요약 통계량이라고 한다. * 대표적인 기술통계량 대표값(위치 파악) 데이터의 퍼짐 정도(형태 파악) 평균값(mean), 중앙값(median), 최빈값(mode) 분산(variance), 표준편차(standard deviation) - 변수는 확률분포를 가지는데, 이때 확률분포의 위치와 형태를 파악하는것이 중요하다. 위치와 형태를 결정하는 것이 평균, 분산, 공분산이다. 01. 평균(mean) 1-1. 이산변수의 평균 표본 크기 n인 양적 변수 표본..