第十四章《随着观测数据增加,预测区间变窄——正态母群体的便利商品、样本均值》。
总结
- 正态母群体的样本均值的性质
正态母群体的样本均值为$\mu$,总体标准差为$\sigma$时,观测到的n个数据x的样本均值$\frac{}{x}$(将它们的集合作为别的母群体时)的分布仍为正态分布。$\frac{}{x}$的分布平均值仍为$\mu$,但标准差为$\frac{\sigma}{\sqrt{n}}$,与母群体相比缩小了$\sqrt{n}$分之一。
- 正态母群体的样本均值的95%预测命中区间
对于总体的均值为$\mu$,总体标准差为$\sigma$的正态分布数据的n个样本均值$\frac{}{x}$来说,95%预测命中区间为,
$(\mu-1.96\frac{\sigma}{\sqrt{n}})$以上$(\mu+1.96\frac{\sigma}{\sqrt{n}})$以下。
- 正态母群体的样本均值的95%的预测命中区间:不等式表示
对于总体均值为$\mu$,总体标准差为$\sigma$的正态母群体数据的n个样本均值$\frac{}{x}$来说,95%预测命中区间为由
$$-1.96\leq\frac{\frac{}{x}-\mu}{\frac{\sigma}{\sqrt{n}}}\leq+1.96$$解得的范围。
练习
将日本成年女性全体的身高数据作为母群体。这个母群体的总体均值为160cm,总体标准差为10cm。
只从这个母群体中取1个数据中,如果想要预测它并有95%的概率猜中,那么可以预测这个范围,
(160)- 1.96 x (10) ~ (160) + 1.96 x (10)
即(140.4) ~ (179.6)。只从这个母群体中取4个数据作为样本均值。
如果想要预测它并有95%的概率猜中,那么可以预测这个范围,
(160) - 1.96 x ($\frac{10}{\sqrt{4}}$) ~ (160) + 1.96 x ($\frac{10}{\sqrt{4}}$)
即 (150.2) ~ (169.8)。只从这个母群体中取25个数据作为样本均值。
如果想要预测它并有95%的概率猜中,那么可以预测这个范围,
(160) - 1.96 x ($\frac{10}{\sqrt{25}}$) ~ (160) + 1.96 x ($\frac{10}{\sqrt{25}}$)
即 (156.08) ~ (163.92)。