理解和计算标准偏差

标准偏差是平均金额变化性在您的数据集中。它告诉您,平均而言,每个价值从中遵循多远意思是

高标准偏差意味着值通常远离平均值,而低标准偏差指示值靠近平均值。

标准偏差告诉您什么?

标准偏差是蔓延的有用措施正常分布

在正常分布中,数据对称地分布,没有偏斜。大多数值围绕中心区域群集,值逐渐变为远离中心。标准偏差告诉您如何从分发的中心分开您的数据平均值。

许多科学变量遵循正常分布,包括高度,标准化测试分数或工作满意度评级。当您有不同样本的标准偏差时,您可以使用它们的分布进行比较统计测试对他们来自的较大人口的推论。

示例:比较不同的标准偏差
您可以使用三组员工收集关于工作满意度评级的数据简单的随机抽样

均值 (m每个组的评分是相同的 - 这是曲线处于峰值时x轴的值。但是,他们的标准偏差(SD.)彼此不同。

标准偏差反映了分布的分散。具有最低标准偏差的曲线具有高峰和小展开,而具有最高标准偏差的曲线更平坦和广泛。

一个图表,显示三个样本的分布,具有不同的标准偏差

经验规则

标准偏差和均值可以告诉您,如果它们遵循正常分布,则分发中的大部分值都可以介绍。

经验法则,或者68-95-99.7规则,告诉你你的值谎言的位置:

  • 大约68%的分数在平均值的2个标准偏差范围内,
  • 大约95%的分数在平均值的4个标准偏差范围内,
  • 大约99.7%的分数在平均值的标准偏差范围内。
示例:正态分布中的标准偏差
您向一组学生提供内存召回测试。数据遵循正常分布,平均得分为50,标准偏差为10。

遵循经验规则:

  • 大约68%的分数介于40到60之间。
  • 大约95%的分数介于30到70之间。
  • 大约99.7%的分数介于20到80之间。

显示正态分布的经验规则的图表。

经验规则是一种快速的方法来获取数据概述,并检查任何不遵循此模式的异常值或极端值。

对于非正常分布,标准偏差是一种不那么可靠的可变性衡量标准,并且应与其他措施相结合使用范围或者狭窄的范围

群体和样品的标准偏差公式

不同的公式用于计算标准偏差,具体取决于您是否具有来自整个人口或样本的数据。

人口标准偏差

当您从每个成员收集数据时人口您对您感兴趣的,您可以获得人口标准偏差的确切值。

人口标准偏差公式如下所示:

公式 解释
公式找到人口的标准偏差。
  • Σ=人口标准差
  • σ= ......
  • X=每个值
  • μ=群体意味着
  • N=人口中的值数

样本标准偏差

从样本收集数据时,使用样本标准偏差用于估计或推论关于人口标准差。

样本标准偏差公式如下所示:

公式 解释
配方以找到样本的标准偏差。
  • S.=样本标准偏差
  • σ= ......
  • X=每个值
  • X=样本意味着
  • N=样本中的值数

使用样品,我们使用N- 1在公式中因为使用N会给我们一个偏见的估计,始终如一地低估了变异性。样本标准偏差往往低于人口的真正标准偏差。

减少样品NN- 1使标准偏差构成大,为您提供保守的可变性。

虽然这不是一个无偏见的估计,但它是对标准偏差的偏差估计值较小:更好地高估而不是低估样品的可变性。

你的抄袭是什么?

将您的论文与超过6000亿网络页面和3000万个出版物进行比较。

  • 2020年18luck新利备用网登录最好的抄袭验证者
  • 抄袭报告和百分比
  • 最大的抄袭数据库

Scribbr 18luck新利备用网登录Plagiarism Checker.

计算标准偏差的步骤

标准偏差通常由您用于统计分析的软件自动计算。但是您还可以用手计算它以更好地了解公式的工作原理。

有六个主要步骤,用于通过手寻找标准偏差。我们将使用一个小型数据集6分钟来浏览步骤。

数据集
46. 69. 32. 60. 52. 41.

步骤1:找到平均值

找到平均值,添加所有分数,然后将它们除以分数的数量。

意思是(x̅)
X=(46 + 69 + 32 + 60 + 52 + 41)÷6=50.

第2步:找到每个分数的偏差与平均值

从每个分数中减去平均值以使偏差与平均值。

自从X= 50,这里我们从每个分数中拿走50。

分数 偏离平均值
46. 46 - 50 =-4
69. 69 - 50 =19.
32. 32 - 50 =-18
60. 60 - 50 =10.
52. 52 - 50 =2
41. 41 - 50 =-9

第3步:平方从平均值偏差

将每个偏差乘以自身的平均值。这将导致正数。

从平均值的平方偏差
(-4)2= 4×4 =16.
19.2= 19×19 =361.
(-18)2= -18×-18 =324.
10.2= 10×10 =100.
22= 2×2 =4.
(-9)2= -9×-9 =81.

第4步:找到正方形的总和

加起来所有平方偏差。这被称为平方和。

平方和
16 + 361 + 324 + 100 + 4 + 81 =886.

第5步:找到方差

划分正方形的总和N- 1(对于a样本) 或者N(对于人口) - 这是方差

由于我们使用6的样本大小,我们将使用N- 1,在哪里N= 6。

方差
886÷(6 - 1)= 886÷5 =177.2

第6步:找到方差的平方根

要找到标准偏差,我们采取方差的平方根。

标准偏差
√177.2=13.31

从学习那样SD.= 13.31,我们可以说每个分数平均偏离13.31点的平均值。

为什么标准差是可变性的有用衡量标准?

虽然有更简单的方法来计算可变性,但标准偏差公式重量不均匀地分布出均匀扩展的样品。一个更高的标准偏差告诉您,分布不仅要展开,而且更加不均匀地展开。

这意味着它可以让您更好地了解您的数据的可变性,而是措施,例如平均绝对偏差(MAD)。

疯狂类似于标准偏差,但更容易计算。首先,通过将它们转换为正数(例如,-3变为3)来首先表达来自绝对值中的平均值的偏差。然后,计算这些绝对偏差的平均值。

与标准偏差不同,您不必为MAD计算数字的正方形或平方根。但是,就此而言,它为您提供了更精确的可变性的衡量标准。

让我们采取两个具有相同中心倾向但不同量的变异性的样本。样品B比样品A更变。

价值 意思是 意味着绝对偏离 标准偏差
样本A. 66,30,40,44 50. 15. 17.8
样品B. 51,21,79,49 50. 15. 23.7

对于具有平均平均值的平均偏差的样本,疯狂不能区分差异。标准偏差更精确:样品偏差的变异性更高,从平均值偏差更高。

通过平衡与平均值的差异,标准偏差更准确地反映不均匀的分散。这一步骤比小偏差更重大偏差。

但是,这也使标准偏差对异常值敏感。

关于标准偏差的常见问题

有什么可变性措施?

变化性最常见的是用以下方式衡量描述性统计

标准偏差告诉您什么?

标准偏差是平均金额变化性在您的数据集中。它平均地告诉你每个分数谎言的距离均值

在正常分布中,高标准偏差意味着值通常远离平均值,而低标准偏差指示值靠近平均值。

什么是正常分布?

在一个正常分布,数据对称地分布不具有偏斜。大多数值围绕中心区域群集,值逐渐变为远离中心。

中央趋势措施(平均值,模式和中值)在正常分布中完全相同。

什么是经验规则?

经验规则,或者68-95-99.7规则,告诉你大部分的价值观正常分布

  • 大约68%的值是1标准偏差意思。
  • 大约95%的值是平均值的2个标准偏差范围内。
  • 大约99.7%的值是平均值的3个标准偏差范围内。

经验规则是一种快速的方法来获取数据概述,并检查任何不遵循此模式的异常值或极端值。

标准偏差和方差之间有什么区别?

方差是平均平均的平均方形偏差标准偏差这个数字的平方根。这两项措施都反映出来变化性在分布中,但他们的单位有所不同:

  • 标准偏差以与原始值相同的单位表示(例如,分钟或米)。
  • 方差以更大的单位表示(例如,平方米)。

虽然方差单位难以直观理解,但方差很重要统计测试

这篇文章有用吗?
0.
Pritha bhandari.

Pritha有一个英语,心理学和认知神经科学的学术背景。作为跨学科研究员,她喜欢写文章,了解学生和学者的棘手的研究概念。

1条评论

Pritha bhandari.
Pritha bhandari(Scribbr队)
9月17日,2020年下午6:57

谢谢阅读!希望你发现这篇文章有用。如果有的话尚不清楚,或者如果你没有找到你在这里寻找的东西,请留下评论,我们会看看我们是否可以提供帮助。

还有疑问吗?

请单击左侧的复选框以验证您是不是机器人。