0%

统计学与pandas学习(二)

第二章《平均值的作用和把握方法》。

统计量是概括数据的数值

所谓统计量,是“用一个数字来概括数据的特征”。具体说就是“平均值”、“方差”和“标准方差”。

平均值

“用数据的合计除以数据数“得到的东西。

频数分布表上的平均值

以女大学生身高为例:

A 组值 B 相对频数 AxB
143 0.0125 1.7875
148 0.075 11.1
153 0.2375 36.3375
158 0.375 59.25
163 0.225 36.675
168 0.075 12.6
AxB的合计=(平均值) 157.75

组数x相对频数的合计=平均值。因为频数分布舍弃了原始数据的一部分信息,所以此平均值与原始数据取得的平均值有差别。

平均值的性质

  • 数据分布在平均值周边。
  • 多次出现的数据对平均值有大的影响。
  • 在直方图呈左右对称的情况下,平均值在对称轴的位置上。

练习

根据虚构的数据,填好频数分布图,计算平均值。

组值 频数 相对频数 组值x相对频数
30 5 0.05 1.5
50 10 0.1 5
70 15 0.15 10.5
90 40 0.4 36
110 20 0.2 22
130 10 0.1 13
合计100 合计(平均值)88

计算平均值的4种方法

  1. 算数平均数:数值相加除以数值个数
  2. 几何平均数:数值相乘,对乘积开平方
  3. 均方根值:数值相加,和除以2,对结果开平方
  4. 调和平均数:1分别除以数值然后相加,2除以相加的和