0%

统计学与pandas学习(十四)

第十四章《随着观测数据增加,预测区间变窄——正态母群体的便利商品、样本均值》。

总结

  • 正态母群体的样本均值的性质

正态母群体的样本均值为$\mu$,总体标准差为$\sigma$时,观测到的n个数据x的样本均值$\frac{}{x}$(将它们的集合作为别的母群体时)的分布仍为正态分布。$\frac{}{x}$的分布平均值仍为$\mu$,但标准差为$\frac{\sigma}{\sqrt{n}}$,与母群体相比缩小了$\sqrt{n}$分之一。

  • 正态母群体的样本均值的95%预测命中区间

对于总体的均值为$\mu$,总体标准差为$\sigma$的正态分布数据的n个样本均值$\frac{}{x}$来说,95%预测命中区间为,

$(\mu-1.96\frac{\sigma}{\sqrt{n}})$以上$(\mu+1.96\frac{\sigma}{\sqrt{n}})$以下。

  • 正态母群体的样本均值的95%的预测命中区间:不等式表示

对于总体均值为$\mu$,总体标准差为$\sigma$的正态母群体数据的n个样本均值$\frac{}{x}$来说,95%预测命中区间为由
$$-1.96\leq\frac{\frac{}{x}-\mu}{\frac{\sigma}{\sqrt{n}}}\leq+1.96$$解得的范围。

练习

将日本成年女性全体的身高数据作为母群体。这个母群体的总体均值为160cm,总体标准差为10cm。

  1. 只从这个母群体中取1个数据中,如果想要预测它并有95%的概率猜中,那么可以预测这个范围,
    (160)- 1.96 x (10) ~ (160) + 1.96 x (10)
    即(140.4) ~ (179.6)。

  2. 只从这个母群体中取4个数据作为样本均值。
    如果想要预测它并有95%的概率猜中,那么可以预测这个范围,
    (160) - 1.96 x ($\frac{10}{\sqrt{4}}$) ~ (160) + 1.96 x ($\frac{10}{\sqrt{4}}$)
    即 (150.2) ~ (169.8)。

  3. 只从这个母群体中取25个数据作为样本均值。
    如果想要预测它并有95%的概率猜中,那么可以预测这个范围,
    (160) - 1.96 x ($\frac{10}{\sqrt{25}}$) ~ (160) + 1.96 x ($\frac{10}{\sqrt{25}}$)
    即 (156.08) ~ (163.92)。