autre version

\displaystyle\sum_{i,k}{(x_{ik}-\bar{\bar x})^2}=\sum_{i,k}(x_{ik}-\bar x_k)^2+\sum_{k=1}^p{n_k}(\bar x_k-\bar{\bar x})^2

 

\displaystyle\sum_{i,k}{(x_{ik}-\bar{\bar x})^2}=\sum_{k=1}^pn_k(\frac 1n_k\sum_{i=1}^{n_k}(x_{ik}-\bar x_k)^2)+\sum_{k=1}^pn_k(\bar x_k-\bar{\bar x})^2)

 

\displaystyle\sum_{i,k}{(x_{ik}-\bar{\bar x})^2}=\sum_{k=1}^p n_k *v_k+\sum_{k=1}^pn_k(\bar x_k-\bar{\bar x})^2) avec \displaystyle v_k la variance de \displaystyle E_k.

 

Divisons par N pour obtenir la variance :

\displaystyle\frac1N(\sum_{i,k}{(x_{ik}-\bar{\bar x})^2})=\frac1N(\sum_{k=1}^p n_k *v_k)+\frac1N\sum_{k=1}^pn_k(\bar x_k-\bar{\bar x})^2)

D’où :

variance(population) = moyenne(variances) + variance(moyennes)