위키피디아와 DeepLearning Book을 바탕으로, 참고하기 위해 정의와 성질 순서로 간단하게만 정리한 글입니다.
Expectation
- 사건에 대한 확률 변수와 그 사건이 벌어질 확률을 곱한 것을 전체 사건에 대해 합한 값
- 확률적 사건에 대한 평균의 의미
Ex∽P[f(x)]=x∑P(x)f(x)
Ex∽p[f(x)]=∫p(x)f(x)dx
E[cX]=cE[X]
E[X+Y]=E[X]+E[Y]
E[αX+βY]=αE[X]+βE[Y]
Variance
- 확률변수가 기댓값으로부터 얼마나 떨어진 곳에 분포하는지를 가늠하는 숫자
- 관측값에서 평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 개수로 나눔. 즉, 차이값의 제곱의 평균
Var[f(x)]=E[(f(x)−E[f(x)])2]=E[(f(x)−μ)2]
Var[c]=0
Var[cX]=c2Var[X]
Var[X]=E[X2]−(E[X])2=E[X2]−μ2
Var[X+Y]=Var[X]+Var[Y]+2E[(X−μx)(Y−μy)]=Var[X]+Var[Y]+2Cov[X,Y]
Covariance
- 2개의 확률변수의 상관정도를 나타내는 값
- 2개의 변수 중 하나의 값이 상승하는 경향을 보일 때, 다른 값도 상승하는 경향의 상관관계에 있다면, 공분산의 값은 양수가 될 것이며, 반대로 2개의 변수중 하나의 값이 상승하는 경향을 보일 때, 다른 값이 하강하는 경향을 보인다면 공분산의 값은 음수
- 상관관계의 상승 혹은 하강하는 경향을 이해할 수 있으나 2개 변수의 측정 단위의 크기에 따라 값이 달라지므로 상관분석을 통해 정도를 파악하기에는 부적절. 상관분석에서는 상관관계의 정도를 나타내는 단위로 모상관계수 ρ를 사용
Cov[f(x),g(y)]=E[(f(x)−E[f(x)])(g(y)−E[g(y)]]=E[(f(x)−μx)(g(y)−μy)]
Cov[c,X]=0
Cov[αX,βy]=αβCov[X,Y]
Cov[α+X,β+Y]=Cov[X,Y]