<aside> 💡 머신러닝, 딥러닝, 통계학 등 확률을 다루는 분야를 공부함에 있어 확률변수(random variable)의 개념은 필수적. 다양한 분야에서 확률변수를 대상으로 여러가지 연산을 하게 되는데요, 확률변수의 개념을 제대로 이해하지 못하고 학습시킬 경우 엉뚱한 결과가 나올 수도 있다.
</aside>
확률변수(random variable)란, 확률현상에 기인해 결과값이 확률적으로 정해지는 변수를 의미한다.
확률현상이란 어떤 결과들이 나올지는 알지만 가능한 결과들 중 어떤 결과가 나올지는 모르는 현상.
확률변수는 ‘변수’. 그럼 어떻게 변하는 것이냐, 바로 확률적으로 변하는 것입니다. 즉, 우리 주변에 확률적인 현상이 존재할때, 확률변수는 확률적으로 정해지는 것
100원짜리 동전을 던지는 상황을 가정해봅시다. 동전을 던지는 상황은 확률현상이죠. 앞이 나올지 뒤가 나올지 알 수 없으니까요. 그리고 X를 100원짜리 동전을 한 번 던졌을 때 이순신 장군이 나오는 횟수라고 하면, X는 확률현상에 기인해 결과값이 확률적으로 정해지므로 확률변수라는 것을 알 수 있습니다.
동전을 한번 던졌을 때 나올수있는 결과는 이순신 또는 숫자 100이므로 확률변수 X는 0 또는 1을 가집니다. X는 확률변수이므로 0 또는 1이 될 수 있다는 뜻입니다. 즉, 동전을 던졌을때 숫자 100이 나오면 이순신 장군이 나온 횟수는 0이므로 확률변수 X=0이고, 이순신 장군이 나오면 이순신 장군이 나온 횟수는 1이므로 확률변수 X=1이 되는 것입니다.
여기서 확률의 개념 까지 보면, 확률변수 X가 0일 확률, 즉, X=0일 확률 = P(X=0)은 1/2입니다. 동전을 던져서 숫자가 나올 확률은 50%라는 뜻이죠. 마찬가지로 X=1일 확률, 즉 P(X=1)도 1/2입니다. 동전을 던저셔 이순신이 나올 확률도 50%니까요.
<aside> 💡 확률분포(probability distribution)은 확률변수가 특정한 값을 가질 확률을 나타내는 함수를 의미한다.
</aside>
확률분포는 ‘함수’를 의미하기도 한다. 함수란 쉽게 mapping을 의미합니다. 즉, 함수란 집합의 임의의 한 원소를 다른 집합의 한 원소에 대응시키는 관계를 의미합니다. 즉, 확률분포란 확률변수가 특정 값을 가질 확률이 얼마나 되느냐를 나타내는 것이다.