期待値と分散と共分散

シェアする

 

期待値

期待される値。それぞれの値とその時の確率の積の総和になる。

 

定義

\(E(X)\)で表す。確率変数\(X\)が\(a_{k}\)を取る確率がPであるとき

\(E[X]=\displaystyle\sum_{k=1}^{n} a_{k} P(X=a_{k})\)

※連続分布の場合、積分に置き換わります。

 

公式

\(E[\alpha X+\beta Y]=\alpha E[X]+\beta E[Y]\) ※線形性

\(E[X+k]=E[X]+k\)

\(E[XY]=E[X]E[Y]\) ※無相関な場合

 

分散

分散はデータの散らばり度合いを表す。

 

定義

\(V(X)\)、\(\mathrm{Var}(X)\)などと書く。

\(\mathrm{Var}(X)=E[(X-E[X])^2]\)

 

公式

\(\mathrm{Var}(X)=E[X^2]-E[X]^2\)

\(\mathrm{Var}(aX)=a^2 \mathrm{Var}(X)\)

\(\mathrm{Var}(X+Y)=\mathrm{Var}(X)+\mathrm{Var}(Y)\) ※無相関なとき

\(\mathrm{Var}(X+k)=\mathrm{Var}(X)\)

\(\mathrm{Var}(X)\geq 0\)

 

証明

\(\mathrm{Var}(X)=E[(X-E[X])^2]\)  ※定義より

\(=E[X^2-2E[X]X+E[X]^2]\)

\(=E[X^2]-2E[X]E[X]+E[X]^2\) ※期待値の線形性を使った。

\(=E[X^2]-E[X]^2\)

 

\(\mathrm{Var}(aX)=E[(aX-E[aX])^2]\)

\(=E[(aX-aE[X])^2]\) ※係数は出せる

\(=E[a^2(X-E[X])^2]=a^2 E[(X-E[X])^2]\)

\(=a^2\mathrm{Var}(X)\)

 

\(\mathrm{Var}(X+Y)= E[(X+Y)^2]-(E[X+Y])^2\) ※公式

\(= E[X^2+2XY+Y^2]-(E[X]^2+2E[X]E[X]+E[Y]^2)\)

\(= E[X^2]+E[Y^2]-E[X]^2-E[Y]^2+2(E[XY]-E[X]E[Y])\)

\(= \mathrm{Var}(X)+\mathrm{Var}(Y)\)    ※無相関なので最後の項消える

 

\(\mathrm{Var}(X+k)=E[(X+k-E[X+k])^2]\)

\(=E[(X+k-(E[X]+k))^2]=E[(X-E[X])^2]\)

\(=\mathrm{Var}(X)\)

 

共分散

対応する二組のデータの間の関係を表す。

 

定義

\(\mathrm{Cov}(X,Y)=E[(X-E[X])(Y-E[Y])]\)

 

公式

\(\mathrm{Cov}(X,X)=\mathrm{Var}(X)\) ※定義見たらそうなる。

\(\mathrm{Cov}(aX,bY)=ab\mathrm{Cov}(X,Y)\) ※それぞれ外に出せるから

\(\mathrm{Cov}(X,Y)=E[XY]-E[X]E[Y]\)

\(V[X+Y]=V[X]+V[Y]+2\mathrm{Cov}(X,Y)\)

 

証明

\(\mathrm{Cov}(X,Y)= E[(X-E[X])(Y-E[Y])] \)

\(= E[XY-E[X]Y-E[Y]X+E[X]E[Y]]\)

\( =E[XY]-E[X]E[Y]-E[Y]E[X]+E[X]E[Y]\) ※線形性

\( =E[XY]-E[X]E[Y]\)

 

下は先ほどの分散の3つ目の計算と同じだが、相関部分が残って共分散に対応。

\(\mathrm{Var}(X+Y)= E[(X+Y)^2]-(E[X+Y])^2\) ※公式

\(= E[X^2+2XY+Y^2]-(E[X]^2+2E[X]E[X]+E[Y]^2)\)

\(= E[X^2]+E[Y^2]-E[X]^2-E[Y]^2+2(E[XY]-E[X]E[Y])\)

\(= \mathrm{Var}(X)+\mathrm{Var}(Y)+2\mathrm{Cov}(X,Y)\)

 

 

 

 

 

シェアする