单元30:标准差

这一主题需要一个信仰的飞跃。这是这个教科书会说“别担心的罕见时期之一为什么这是真的;只接受它。“

一种正常分布,经常被称为a钟形曲线,在左右对称,具有平均值,中位数和模式是中心的值。中心附近有很多数据值,然后较少,更少,因为这些值从中心进一步获得。正常分布描述了许多现实世界情况的数据:人们的高度,人的重量,测量中的错误,标准化测试的分数(IQ,SAT,ACT)......

证明正常分布的最佳方法之一是通过均匀间隔的钉板滴下球,如这里所示。[1]每次一个球击中钉子时,它都有五十五万的机会离开或右边。对于大多数球来说,左边和权利的数量大致相等,球落在中心附近。只有几个球有一个极其不平衡的左和权利,因此两端都没有很多球。正如您所看到的,分布并不完美,但它近似于玻璃上绘制的正常曲线。

显示球的科学博物馆示范滴下形成响铃曲线

标准偏差是数据传播的衡量标准:具有靠近平均值的大量数字的数据具有较小的标准偏差,并且具有较大的标准偏差的数字间隔的数字具有更大的标准偏差。(在本文中,您将获得数据标准偏差的值,并且永远不需要计算它。)标准偏差是针对特定数据集的测量棒。

在正态分布中…

  • 大致68 \%这些数字都在内1标准偏差在平均值上方或下方
  • 大致95 \%这些数字都在内2高于或低于均值的标准差
  • 大致99.7 \%这些数字都在内3.高于或低于均值的标准差

68 - 95 - 99.7规则被称为A.经验法则因为它是基于观察而不是公式。没有人找到计算方法来算出这些数字68 \%95 \%, 和99.7 \%直到事实发生。相反,统计学家研究了很多正态分布数据的不同例子然后说周一死,似乎如果您计算在均值上方或下方的一个标准偏差范围内的数据值,则会68 \%数据!“等等。[2]

以下形象是瑞典语,但您可能会破译它,因为数学是一种国际语言。

显示68-95-99.7规则:匹配垂直线一个单元到中心的左侧和右侧包括68%的数据,匹配垂直线到中心的左右两个单元包括95%数据,并将垂直线匹配到中心左侧和右侧的三个单元包括99.7%的数据。

让我们回到球场的实验,让我们假设标准偏差是三列宽。[3]在下面的图片中,绿色线标记了分布的中心。

显示球的科学博物馆示范滴下形成响铃曲线,绘制垂直线以显示标准偏差

第一,两者红色的线是远离中心的三列,这是一个标准偏差以上和下方中央如此68%球将在红线之间落地。

接下来,这两个人橙色线是另一个三列远离中心,这是六列或两个标准偏差以上和下方中央如此95%球将在橙色线之间落地。

最后,这两个人紫色的线是另一个从中心远离中心的三列,这是九列或三个标准偏差以上和下方中央如此99.7%球将在紫线之间落地。我们可以期待997.1,000球将在紫色线之间落地,只留下3.1,000在任何一端都在紫色线上着陆。


在这里,Damian Lillard的游戏结果对于越来越多的秩序而得分80他在2018 - 19年的NBA赛季玩过的游戏。[4]这被分成八行,每行十个数字,这是总共2,069点。

11.13.13.13.14.14.15.15.15.16.
16.16.17.17.17.18.18.19.19.20.
20.20.20.20.21.21.22.22.23.23.
23.23.24.24.24.24.24.24.24.24.
25.25.25.26.26.26.28.28.28.29.
29.29.29.30.30.30.30.30.31.31.
33.33.33.33.33.33.34.34.34.35.
36.36.37.39.404041.41.42.51.

练习

这是对平均值,中位数和模式的审查;您需要知道均可以完成遵循的标准偏差练习。

1。数据的平均值是什么?(舍入到最近的十分之一。)

2。数据的中位数是什么?

3.数据的模式是什么?

4。是否有任何平均值,中位数或模式似乎误导,或者这三个似乎都似乎相当好地代表了数据?

这里是数据的直方图,以七个同等间隔的间隔任意分组。它表明,数据粗略地遵循钟形曲线,左侧截断左侧和异常值在右边。

柱状图或条形图显示12分数11至17日16得分高于17日和22日,21日得分高于22 - 28,17个分数高于28岁,34岁,8分数以上34岁和40,5得分高于40 - 45,1得分高于45 - 51。

如果我们将数据输入到Microsoft Excel或Google纸牌等电子表格计划中,我们可以快速发现标准偏差是8.2点。

基于经验规则,我们应该预期大约68 \%在内部的结果8.2上方和低于平均值。

练习

5。确定在平均值的一个标准偏差范围内得分的分数范围。

6。有多少80游戏结果在平均值的一个标准偏差范围内?

7。以前的答案接近68 \%游戏结果的总数是多少?

我们应该预期大约95 \%在内部的结果2 \ cdot8.2 = 16.4上方和低于平均值。

练习

8。确定评分的分数范围在平均值的两个标准偏差范围内。

9。有多少80博弈结果是否在均值的两个标准差范围内?

10.以前的答案接近95 \%游戏结果的总数是多少?

我们应该预期大约99.7 \%在内部的结果3 \ cdot8.2 = 24.6上方和低于平均值。

练习

11.确定在平均值的三个标准偏差范围内得分的分数范围。

12.有多少80游戏结果在平均值的三个标准偏差范围内?

13。以前的答案接近99.7 \%游戏结果的总数是多少?

请注意,我们可以考虑标准偏差,如测量误差或宽容:平均值\ PM8.2., 均值\ PM16.4, 均值\ PM24.6......

练习

对于美国女性,平均身高是周围的63.5英寸 (5.FT.3.5在)和标准偏差是3.英寸。使用经验规则填补空白。

14。关于68 \%女性应该在_______和_______英寸之间。

15。关于95 \%女性应该在_______和_______英寸之间。

16。关于99.7 \%女性应该在_______和_______英寸之间。

美国男性的平均身高大约是69.5英寸 (5.FT.9.5在)和标准偏差是3.英寸。使用经验规则填补空白。

17。关于68 \%男人应该在_______和_______英寸之间。

18。关于95 \%男人应该在_______和_______英寸之间。

19。关于99.7 \%男人应该在_______和_______英寸之间。

这个图表https://tall.life/height-percentile-calculator-age-country/表明,由于标准偏差等于,两个钟曲线具有基本相同的形状,但女性的图形以6英寸为中心的男性。

练习

大约16 \%他们四十年代的男性重量比160.磅,16 \%重量比230.磅。[5]假设正常分布。

20.美国男性中有多少人的体重介于160.磅,230.磅?

21.什么是平均重量?(提示:考虑对称性。)

22.什么是标准差?(提示:你必须向后工作以解决这个问题,但数学不是复杂的。)

23。根据经验法则,约95 \%男人应该在_______和_______磅之间重量。

如果您只要求一个关于经验规则的一个问题而不是连续三个问题(68 \%95 \%99.7 \%),你很可能会被问到95 \%。这和"95 \%置信区间“通常与统计相关。例如,轮询误差的余量通常接近两个标准偏差。[6]

让我们通过比较自世纪之交以来三个NFL团队的表现来完成。

新英格兰爱国者赢得的常规赛季节的数量来自2001 - 19年的NFL赛季:[7]

2001年 11.
2002年 9.
2003年 14.
2004年 14.
2005年 10.
2006年 12.
2007年 16.
2008年 11.
2009年 10.
2010年 14.
2011年 13.
2012年 12.
2013年 12.
2014年 12.
2015年 12.
2016年 14.
2017年 13.
2018年 11.
2019年 12.

练习

对于爱国者来说,胜利的平均数是12.2,并且电子表格告诉我们标准偏差是1.7赢了。

24。有一个95 \%爱国者的机会在_______和_______在一个赛季中的游戏。

25。2020年,爱国者队获胜7.游戏。你能根据数据预测到这一点吗?赢的次数离均值有多少个标准差远?

Buffalo Bills从2001年至19年的Buffalo Bills赢得常规赛季节的数量:[8]

2001年 3.
2002年 8.
2003年 6.
2004年 9.
2005年 5.
2006年 7.
2007年 7.
2008年 7.
2009年 6.
2010年 4.
2011年 6.
2012年 6.
2013年 6.
2014年 9.
2015年 8.
2016年 7.
2017年 9.
2018年 6.
2019年 10.

练习

对于账单,胜利的胜利数量是6.8,并且电子表格告诉我们标准偏差是1.7赢了。

26。有一个95 \%票据在_______和_______在一个季节赢得的机会。

27。2020年,票据赢了13.游戏。你能根据数据预测到这一点吗?赢的次数离均值有多少个标准差远?

丹佛·布朗科斯队的常规赛季比赛的数量来自2001 - 15年的NFL赛季:[9]

2001年 8.
2002年 9.
2003年 10.
2004年 10.
2005年 13.
2006年 9.
2007年 7.
2008年 8.
2009年 8.
2010年 4.
2011年 8.
2012年 13.
2013年 13.
2014年 12.
2015年 12.
2016年 9.
2017年 5.
2018年 6.
2019年 7.

练习

对于野马,胜利的胜利数量是9.1,并且电子表格告诉我们标准偏差是2.6赢了。

28。有一个95 \%在一个季节的_______和_______游戏之间赢得了烧结队的机会。

29。在2020年,Broncos赢了5.游戏。你能根据数据预测到这一点吗?赢的次数离均值有多少个标准差远?


执照

Creative Commons atticution-Noncommercial-Sharealike的图标4.0国际许可证

技术数学经过摩根大通在a下获得许可Creative Commons归因 - 非商业 - Sharealike 4.0国际许可证,除非另有说明。