可变性措施

变化性描述数据点彼此叠加的距离和分布中心。以及措施集中趋势,可变性的测量可以给你描述性统计总结您的数据。

变异性也称为扩散,散射或分散。它是最常用的,下列:

为什么变化物质?

虽然这一点集中趋势或者平均,告诉你大多数要点撒谎,可变性总结了它们的差距。这是重要的,因为它告诉了你是否围绕中心倾向于聚集在一起或者更广泛地展开。

低可变性是理想的,因为它意味着您可以更好地预测关于该信息的信息人口基于样本数据。高可变性意味着这些值不太一致,因此更难做出预测。

数据集可以具有相同的中央趋势,但不同程度的可变性或反之亦然。如果您只知道中央倾向或可变性,则无法对其他方面说任何方面。他们俩一起给您一张完整的数据图片。

示例:正常分布的可变性
您正在调查不同的人每日在手机上花费的时间。

使用简单的随机样本,你从3组收集数据:

  • 样本A:高中生,
  • B:大学生,
  • 样本C:成人全职员工。

一个图表,显示具有相同平均值但不同的变异性的3个样品的分布。

所有三种样品都有相同的平均电话使用,195分钟或3小时15分钟。这是曲线峰值的X轴值。

虽然数据遵循a正常分布,每个样品具有不同的差异。样品A具有最大的可变性,而样品C具有最小的可变性。

范围

该范围告诉您数据从最低值到分布中的最高值的传播。这是最容易变化的衡量标准。

找到范围,只需从数据集中的最高值中减去最低值。

范围示例
您有8个样本A的数据点。

数据(分钟) 72. 110. 134. 190 238. 287. 305. 324.

最高值(H) 是324.和最低(L.) 是72.

R.=H-L.

R.= 324 - 72 =252.

您的数据范围是252分钟

由于仅使用2个数字,因此该范围受异常值的影响,并且不会为您提供有关价值分布的任何信息。最好与其他措施结合使用。

你的抄袭是什么?

将您的论文与超过6000亿网络页面和3000万个出版物进行比较。

  • 2020年18luck新利备用网登录最好的抄袭验证者
  • 抄袭报告和百分比
  • 最大的抄袭数据库

Scribbr 18luck新利备用网登录Plagiarism Checker.

狭窄的范围

狭窄的范围为您提供分布中间的传播。

对于从低到高点的任何分发,狭隘范围包含一半的值。虽然第一个四分位数(Q1)包含了值的前25%,但第四个四分位数(Q4)包含最近的值的值。

正态分布的句子范围

四分位数范围是第三个四分位数(Q3)减去第一个四分位数(Q1)。这为我们提供了数据集的中间半部分的范围。

四分位范围的例子
要查找8个数据点的四分位数范围,首先找到Q1和Q3的值。

将数据集(8)中的值数乘以0.25的第25百分位数(Q1)和第75百分位数(Q3)的0.75。

Q1位置:0.25 x 8 = 2

Q3位置:0.75 x 8 = 6

Q1是第二位置的值,即110.。Q3是第6个位置的值,即287.

IQR = Q3 - Q1

IQR = 287 - 110 =177.

您的数据的四分位数范围是177分钟

就像范围一样,句子范围只在其计算中使用2个值。但IQR受异常值影响较小:2值来自数据集的中半部分,因此它们不太可能是极度分数。

IQR为偏斜和正常分布提供一致的变异性衡量标准。

五号摘要

每个分发都可以使用a组织五号摘要

  • 最低价值
  • Q1:25百分位数
  • Q2:中位数
  • Q3:75百分位数
  • 最高值(Q4)

可以使用框和晶须图来容易地可视化这些五个摘要。

盒子和晶须情节例子
对于每个样本,盒子中的水平线显示Q1,中值和Q3,而最后的晶须显示最高和最低值。

一个框和晶须绘图可视化数据的五号摘要。

标准偏差

标准偏差是数据集中的平均可变性量。

它平均地告诉您每个分数从平均值遵循的距离。标准偏差越大,数据集的变量就越多。

使用手查找标准偏差有六个步骤:

  1. 列出每个分数和找到他们的意思
  2. 从每个分数中减去平均值以使偏差与平均值。
  3. 平方每个这些偏差。
  4. 加起来所有平方偏差。
  5. 划分平方偏差的总和N- 1(对于a样本) 或者N.(为人口)。
  6. 找到您找到的数字的平方根。
标准差示例
第1步:数据(分钟) 第2步:偏离平均值 步骤3 + 4:平方偏差
72. 72 - 207.5 = -135.5 18360.25
110. 110 - 207.5 = -97.5 9506.25.
134. 134 - 207.5 = -73.5 5402.25
190 190 - 207.5 = -17.5 306.25
238. 238 - 207.5 = 30.5 930.25
287. 287 - 207.5 = 79.5 6320.25.
305. 305 - 207.5 = 97.5 9506.25.
324. 324 - 207.5 = 116.5 13572.25
平均=207.5 总和= 0. 平方和=63904
标准差示例
因为你正在处理样本,所以你使用N- 1。

N- 1 =7.

63904/7 =9129.14

标准差示例

S.=√9129.14= 95.54

您的数据的标准偏差是95.54。这意味着平均而言,每个分数偏离均值95.54点。

人群的标准偏差公式

如果您有来自整个人口的数据,请使用人口标准偏差公式:

公式 解释
公式找到人口的标准偏差。
  • Σ=人口标准差
  • σ= ......
  • X=每个值
  • μ=群体意味着
  • N.=人口中的值数

样品标准偏差公式

如果你有来自一个样本的数据,使用样本标准差公式:

公式 解释
配方以找到样本的标准偏差。
  • S.=样本标准偏差
  • σ= ......
  • X=每个值
  • X=样本意味着
  • N=样本中的值数

为什么使用N- 1用于样品标准偏差?

样本用来制造统计推论关于他们来自的人口。

当您有人口数据时,您可以获得人口标准偏差的确切值。由于您从每个人口成员收集数据,标准差反映了您的分布中的可变异量,人口。

但是,当您使用样本数据时,您的样本标准偏差始终用作人口标准偏差的估计。使用N在该公式中,倾向于为您提供偏见的估计,始终如一地低估了变化。

减少样品NN- 1使标准偏差构成大,为您提供保守的可变性。

虽然这不是一个无偏见的估计,但它是对标准偏差的偏差估计值较小:更好地高估而不是低估样品的可变性。

当您具有大的样品大小时,标准差的偏置和保守估计之间的差异会更小。

方差

方差是平均值的平均平均偏差。与平均值的偏差是得分从平均值呈现得分。

方差是标准偏差的平方。这意味着方差单位远大于数据集的典型值。

虽然它更加难以直观地解释方差编号,但重要的是计算用于比较统计测试中的不同数据集的方差Anovas.

方差反映了数据集中的传播程度。数据越传播,方差与平均值越大。

方案示例
为了获得方差,平方标准偏差。

S.= 95.5

S.2= 95.5 x 95.5 = 9129.14

您的数据的差异是9129.14

要找到手动的差异,请执行所有步骤以进行标准偏差,除了最终步骤。

种群的差异公式

公式 解释
种群的差异公式
  • σ.2=人口方差
  • σ= ......
  • χ=每个值
  • μ=群体意味着
  • ν=人口中的值数

样品的方差公式

公式 解释
样品的方差公式
  • S.2=示例方差
  • σ= ......
  • χ=每个值
  • X̄=样本意味着
  • N=样本中的值数

偏见与异常方差的无偏见估计

统计数据的无偏见估计是一个不一致地给您高值或低值的估计 - 它没有系统偏见。

就像是标准偏差一样,有不同的人口和样本方差的公式。但是,虽然没有对标准偏差的无偏见估计,但有一个用于样本方差。

如果样本方差公式使用样品N,样本方差将偏向数量低于预期。减少样品NN- 1使得方差较大。

在这种情况下,偏差不仅降低但完全删除。样本方差公式提供完全无偏见的方差估计。

那么为什么样品标准偏差也不是一个无偏见的估计?

这是因为样本标准偏差来自找到样本方差的平方根。由于平方根不是线性操作,因此除了添加或减法,样品方差公式的无偏率不携带在样品标准偏差公式上。

什么是最佳变化的衡量标准?

最佳变化衡量标准取决于您的测量水平和分布。

测量水平

用于测量的数据序单水平、范围和四分位范围是衡量变异性的唯一合适的方法。

更加复杂间隔比率水平,标准偏差和方差也适用。

分配

对于正常分布,可以使用所有措施。标准偏差和方差是首选,因为它们将整个数据设置为帐户,但这也意味着它们容易受异常值的影响。

对于具有异常值的偏斜分布或数据集,狭隘的范围是最佳措施。它受极端值的影响最小,因为它专注于数据集中间的传播。

关于可变性的常见问题

什么是变化?

变化性告诉你分开彼此和分发中心或数据集的差距多远。

变异性也称为扩散,散射或分散。

有什么可变性措施?

变化性最常见的是用以下方式衡量描述性统计

中央趋势和变异性有什么区别?

集中趋势告诉你大多数数据点谎言,变化性总结了彼此的观点多远。

数据集可以具有相同的中央趋势,但不同程度的可变性或反之亦然。他们一起给你一张完整的数据图片。

描述性和推理统计数据有什么区别?

描述性统计总结数据集的特征。推论统计允许你测试假设或评估您的数据是否普遍普遍为更广泛的人口。

这篇文章有用吗?
0.
Pritha bhandari.

Pritha有一个英语,心理学和认知神经科学的学术背景。作为跨学科研究员,她喜欢写文章,了解学生和学者的棘手的研究概念。

1条评论

Pritha bhandari.
Pritha bhandari(Scribbr队)
9月7日,2020年下午7:44

谢谢阅读!希望你发现这篇文章有用。如果有的话尚不清楚,或者如果你没有找到你在这里寻找的东西,请留下评论,我们会看看我们是否可以提供帮助。

还有疑问吗?

请单击左侧的复选框以验证您是不是机器人。