0%

统计学与pandas学习(十三)

第十三章《复数数据的平均值比1个数据接近总体均值——样本均值的思维方法》。

总结

  • 观测到的数据,可以在一定程度上认为接近总体均值。
  • 观测复数的数据,它的平均值叫作样本的均值。
  • 观测复数的数据取样本均值,比1个数据更接近总体均值。观测数据越增加,样本均值接近总体均值可能性越高。
  • 大数法则。从1个母群体中,观测n个数据取其样本均值。此时,n越大,样本均值为接近总体均值u的数值的可能性越高。

练习

母群体作如下考虑:

| | | | | |
|数字(作为数据出现的)|1|2|3|4|
|-|-|-|-|-|
|相对频数(池子的面积=抽取概率)|0.25|0.25|0.25|0.25|

  • 为求样本均值的相对频数做表,填好空白。
1 2 3 4
1 1 1.5 2 2.5
2 1.5 2 2.5 3
3 2 2.5 3 3.5
4 2.5 3 3.5 4
  • 据此,总体均值u=7.

  • 作样本均值的相对频数的表

样本均值 1 1.5 2 2.5 3 3.5 4
相对频数 1/16 2/16 3/16 4/16 3/16 2/16 1/16
  • 做成直方图
1
2
3
4
import pandas as pd
df = pd.DataFrame([[1,1/16],[1.5,2/16],[2,3/16],[2.5,4/16],[3,3/16],[3.5,2/16],[4,1/16]],columns=['a','b'])
%matplotlib inline
df.plot(kind='bar',width=0.99,x=['a'],y=['b'])