0%

统计学与pandas学习(七)

第七章《身高、掷硬币等最常见的分布、正态分布》。

总结

  1. 正态分布是自然界和人类社会中最常见的分布。比如,在身高数据和掷硬币正面出现枚数的数据中就很常见。
  2. 标准正态分布,平均值=0, S.D.=1。
  3. 关于标准正态分布,
    • ( +1 ) ~ ( -1 )范围的数据(距平均值1个S.D.范围以内的数据)的相对频数为0.6826(70%弱);
    • ( +2 ) ~ ( -2 )范围的数据(距平均值2个S.D.范围以内的数据)的相对频数为0.9544(95%强)。
  4. 一般正态分布的数据,由 a x (标准正态分布的数据) + u 可得,平均值=u,S.D.=a。
  5. 平均值为u、S.D.为a的正态分布回到标准正态分布的算式为z=(x-u)/a
  6. 关于平均值为u、S.D.为a的正态分布,
    • (u+1xa)~(u-1xa)范围的数据(距平均值1个S.D.以内范围的数据)的相对频数为0.6826(70%弱);
    • (u+2xa)~(u-2xa)范围的数据(距平均值2个S.D.以内范围的数据)的相对频数为0.9544(95%强)。

练习

在从前那种满分为1000分的“中心考试”中,中心考试成绩为1000分满分,平均分数约为600分、S.D.约为100分的正太分布。
此时,95.44%的数据范围为`(600)-(100)x2 ~ (600)+(100)x2,
所以是(400)~(800)的范围。