理解和计算标准偏差
这标准偏差是平均金额变化性在您的数据集中。它告诉您,平均而言,每个价值从中遵循多远意思是。
高标准偏差意味着值通常远离平均值,而低标准偏差指示值靠近平均值。
标准偏差告诉您什么?
标准偏差是蔓延的有用措施正常分布。
在正常分布中,数据对称地分布,没有偏斜。大多数值围绕中心区域群集,值逐渐变为远离中心。标准偏差告诉您如何从分发的中心分开您的数据平均值。
许多科学变量遵循正常分布,包括高度,标准化测试分数或工作满意度评级。当您有不同样本的标准偏差时,您可以使用它们的分布进行比较统计测试对他们来自的较大人口的推论。
均值 (m每个组的评分是相同的 - 这是曲线处于峰值时x轴的值。但是,他们的标准偏差(SD.)彼此不同。
标准偏差反映了分布的分散。具有最低标准偏差的曲线具有高峰和小展开,而具有最高标准偏差的曲线更平坦和广泛。
经验规则
标准偏差和均值可以告诉您,如果它们遵循正常分布,则分发中的大部分值都可以介绍。
这经验法则,或者68-95-99.7规则,告诉你你的值谎言的位置:
- 大约68%的分数在平均值的2个标准偏差范围内,
- 大约95%的分数在平均值的4个标准偏差范围内,
- 大约99.7%的分数在平均值的标准偏差范围内。
遵循经验规则:
- 大约68%的分数介于40到60之间。
- 大约95%的分数介于30到70之间。
- 大约99.7%的分数介于20到80之间。
经验规则是一种快速的方法来获取数据概述,并检查任何不遵循此模式的异常值或极端值。
对于非正常分布,标准偏差是一种不那么可靠的可变性衡量标准,并且应与其他措施相结合使用范围或者狭窄的范围。
群体和样品的标准偏差公式
不同的公式用于计算标准偏差,具体取决于您是否具有来自整个人口或样本的数据。
人口标准偏差
当您从每个成员收集数据时人口您对您感兴趣的,您可以获得人口标准偏差的确切值。
这人口标准偏差公式如下所示:
公式 | 解释 |
---|---|
|
样本标准偏差
从样本收集数据时,使用样本标准偏差用于估计或推论关于人口标准差。
这样本标准偏差公式如下所示:
公式 | 解释 |
---|---|
|
使用样品,我们使用N- 1在公式中因为使用N会给我们一个偏见的估计,始终如一地低估了变异性。样本标准偏差往往低于人口的真正标准偏差。
减少样品N到N- 1使标准偏差构成大,为您提供保守的可变性。
虽然这不是一个无偏见的估计,但它是对标准偏差的偏差估计值较小:更好地高估而不是低估样品的可变性。
计算标准偏差的步骤
标准偏差通常由您用于统计分析的软件自动计算。但是您还可以用手计算它以更好地了解公式的工作原理。
有六个主要步骤,用于通过手寻找标准偏差。我们将使用一个小型数据集6分钟来浏览步骤。
数据集 | |||||
---|---|---|---|---|---|
46. | 69. | 32. | 60. | 52. | 41. |
步骤1:找到平均值
到找到平均值,添加所有分数,然后将它们除以分数的数量。
意思是(x̅) |
---|
X=(46 + 69 + 32 + 60 + 52 + 41)÷6=50. |
第2步:找到每个分数的偏差与平均值
从每个分数中减去平均值以使偏差与平均值。
自从X= 50,这里我们从每个分数中拿走50。
分数 | 偏离平均值 |
---|---|
46. | 46 - 50 =-4 |
69. | 69 - 50 =19. |
32. | 32 - 50 =-18 |
60. | 60 - 50 =10. |
52. | 52 - 50 =2 |
41. | 41 - 50 =-9 |
第3步:平方从平均值偏差
将每个偏差乘以自身的平均值。这将导致正数。
从平均值的平方偏差 |
---|
(-4)2= 4×4 =16. |
19.2= 19×19 =361. |
(-18)2= -18×-18 =324. |
10.2= 10×10 =100. |
22= 2×2 =4. |
(-9)2= -9×-9 =81. |
第4步:找到正方形的总和
加起来所有平方偏差。这被称为平方和。
平方和 |
---|
16 + 361 + 324 + 100 + 4 + 81 =886. |
第5步:找到方差
划分正方形的总和N- 1(对于a样本) 或者N(对于人口) - 这是方差。
由于我们使用6的样本大小,我们将使用N- 1,在哪里N= 6。
方差 |
---|
886÷(6 - 1)= 886÷5 =177.2 |
第6步:找到方差的平方根
要找到标准偏差,我们采取方差的平方根。
标准偏差 |
---|
√177.2=13.31 |
从学习那样SD.= 13.31,我们可以说每个分数平均偏离13.31点的平均值。
为什么标准差是可变性的有用衡量标准?
虽然有更简单的方法来计算可变性,但标准偏差公式重量不均匀地分布出均匀扩展的样品。一个更高的标准偏差告诉您,分布不仅要展开,而且更加不均匀地展开。
这意味着它可以让您更好地了解您的数据的可变性,而是措施,例如平均绝对偏差(MAD)。
疯狂类似于标准偏差,但更容易计算。首先,通过将它们转换为正数(例如,-3变为3)来首先表达来自绝对值中的平均值的偏差。然后,计算这些绝对偏差的平均值。
与标准偏差不同,您不必为MAD计算数字的正方形或平方根。但是,就此而言,它为您提供了更精确的可变性的衡量标准。
让我们采取两个具有相同中心倾向但不同量的变异性的样本。样品B比样品A更变。
价值 | 意思是 | 意味着绝对偏离 | 标准偏差 | |
---|---|---|---|---|
样本A. | 66,30,40,44 | 50. | 15. | 17.8 |
样品B. | 51,21,79,49 | 50. | 15. | 23.7 |
对于具有平均平均值的平均偏差的样本,疯狂不能区分差异。标准偏差更精确:样品偏差的变异性更高,从平均值偏差更高。
通过平衡与平均值的差异,标准偏差更准确地反映不均匀的分散。这一步骤比小偏差更重大偏差。
但是,这也使标准偏差对异常值敏感。
1条评论
Pritha bhandari(Scribbr队)
9月17日,2020年下午6:57谢谢阅读!希望你发现这篇文章有用。如果有的话尚不清楚,或者如果你没有找到你在这里寻找的东西,请留下评论,我们会看看我们是否可以提供帮助。