0%

统计学与pandas学习(十八)

第十八章《样本方差呈卡方分布——与样本方差成正比的统计量W的做法》。

摘要

  1. 与样本方差成正比的统计量W的做法
    将上一章中V公式的总体均值($\mu$)替换为样本均值($\frac{}{x}$)
    W=[(样本)-(样本均值)]的平方 / (总体方差)的和
    $$=\frac{(x_1-\frac{}{x})^2}{\sigma^2}+\frac{(x_2-\frac{}{x})^2}{\sigma^2}+…+\frac{(x_n-\frac{}{x})^2}{\sigma^2}…(1)$$
    将V作成另外的统计量W,实际上,这个W也是卡方分布。样本方差:
    $$ s^2=\frac{(x_1-\frac{}{x})^2+(x_2-\frac{}{x})^2+…+(x_n-\frac{}{x})^2}{n} …(2)$$
    因此将样本方差$s^2$乘以数据数n=将W乘以总体方差$\sigma^2$
    $$n\times s^2=\sigma^2\times W$$
    所以,样本方差和W的关系式:
    1. $样本方差s^2=W\times (总体方差\sigma^2)\div n$;
    2. $W=(样本方差s^2)\times n\div (总体方差\sigma^2)$
  2. 样本方差的卡方分布自由度下降1
    虽然W也呈卡方分布,但自由度不是数据数,是“数据数减去1”,这与V不同。总结法则为:
    由一般正态母群体作卡方分布W的方法:
    $$W=[(样本)-(样本均值)]的平方\div (总体方差)的和$$
    $$=\frac{(x_1-\frac{}{x})^2}{\sigma^2}+\frac{(x_2-\frac{}{x})^2}{\sigma^2}+…+\frac{(x_n-\frac{}{x})^2}{\sigma^2}$$
    W是呈自由度(n-1)卡方分布的统计量。
    由一般正态母群体的样本方差作卡方分布W的方法:
    从总体均值$\mu$、总体标准差$\sigma$的正态母群体观测n个样本计算所得的样本方差为$s^2$时,
    $$作W=(样本方差s^2)\times n \div (总体方差\sigma^2),得W是自由度(n-1)卡方分布的统计量。$$
    样本方差($s^2)与W的关系式
    $$\frac{(ns^2)}{\sigma^2}=W即\frac{(数据数)\times (样本方差)}{总体方差}=W$$
  3. 例题
    从正态母群体观测的样本是1、5、7、9、13.计算此时的统计量W。另外,它是什么样分布中的数据。
    解答:
    $$\frac{}{x}=\frac{1+5+7+9+13}{5}=7$$
    $$s^2=\frac{36+4+0+4+36}{5}=\frac{80}{5}=16$$
    因此
    $$W=\frac{ns^2}{\sigma^2}=\frac{80}{\sigma^2}$$
    这是自由度(5-1)=4的卡方分布

练习

从正态母群体中抽取4个数据,3、9、11、17.
此时,样本均值$\frac{}{x}=(10)$
样本方差$s^2=\frac{100}{4}=(25)$
样本标准差$s=\sqrt{25}=5$
使用总体方差$\sigma^2$计算W
$$W=\frac{ns^2}{\sigma^2}=\frac{100}{\sigma^2}$$
这个W是自由度为3的卡方分布的数据。