<aside> 💡 모집단과 표본은 통계학의 기본중의 기본이다.
</aside>
표본추출로 구한 표본데이터는 분포를 따르게 되는데요. 분포의 특성을 나타내는데 대표값이라는 개념을 사용합니다. 대표값은 이름 그대로 데이터셋을 대표하는 값을 의미합니다. 그리고 가장 흔히 쓰이는 대표값은 평균, 분산, 표준편차 등이 있습니다.
대표값 = 주요한 통계량
<aside> 💡 평균은 단순히 모든 관측값을 더해서 관측값 개수로 나눈 것이다.
</aside>
<aside> 💡 기대값은 각 사건이 벌어졌을 때의 이득과 그 사건이 벌어질 확률을 곱한 것을 전체 사건에 대해 합한 값이다. 이것은 어떤 확률적 사건에 대한 평균의 의미로 생각할 수 있다.
</aside>
사실 기대값은 평균과 동일하다고 생각해도 크게 문제 되지는 않을 것. 실제로 두 용어를 섞어서 사용하기도 한다.
그러나 평균과 기대값에는 관점의 차이가 있다고 생각한다. 즉, 표본으로부터 얻어진 표본데이터값의 연산 자체에 중점을 두고 보면 평균이고, 확률변수에 중점을 두고 보면 기대값이라고 생각한다. 다른 말로하면 표본은 데이터로부터 이미 구해진 데이터의 평균, 기대값은 아직 구해지지않은 값(미래에 기대되는)에 대한 평균이라고도 볼 수 있을 것