如何找到一个数据集的范围

在统计数据,范围是分布中数据从最低值到最高值的分布。这是一种常用的度量方法可变性

以及一些措施集中趋势,可变性的度量给你描述性统计用于汇总数据集。

该范围是通过从最大值减去最小值来计算的。大的范围意味着高变异性,小的范围意味着低变异性。

计算范围

计算范围的公式为:

求值域的公式

  • R=范围
  • H=最高价值
  • l=最小值

量程是最容易计算的可变性的量度。要找到范围,请遵循以下步骤:

  1. 将数据集中的所有值从低到高排序。
  2. 用最大值减去最小值。

不管你的值是正的还是负的,整数还是分数,这个过程都是一样的。

范围的例子
你的数据集是8岁参与者的年龄。

参与者 1 2 3. 4 5 6 7 8
年龄 37 19 31 29 21 26 33 36

首先,将值从低到高排序以识别最小值(l)最高价值(H)

年龄 19 21 26 29 31 33 36 37

然后用最大值减去最小值。

R=H- - - - - -l

R=37- - - - - -19=18

我们的数据集的范围是18年

这个范围有多有用?

当你有一个没有极值的分布时,范围通常是一个很好的可变性指示器。当搭配集中趋势测度,值域可以告诉你分布张成的空间。

但当数据集中有异常值时,这个范围可能会产生误导。数据中的一个极端值会给出一个完全不同的范围。

带有异常值的范围示例
数据集中的一个值将被替换为离群值

年龄 19 21 26 29 31 33 36 61

使用同样的计算,我们这次得到了一个非常不同的结果:

R=H- - - - - -l

R= 61 - 19 =42

有了异常值,我们的范围是42年

在上面的例子中,范围表明数据中的变异性比实际的要大得多。虽然我们有一个很大的范围,但大多数值实际上是围绕一个明确的中间聚集的。

因为只使用了两个数字,所以范围很容易受到异常值的影响。它不能单独告诉你数值分布的形状。

为了清楚地了解数据的可变性,最好将范围与其他参数结合使用措施的变化就像四分位范围标准偏差

你的剽窃分数是多少?

将你的论文与超过600亿网页和3000万出版物进行比较。

  • 2020年18luck新利备用网登录最佳剽窃检查者
  • 剽窃报告及百分比
  • 最大剽窃数据库

Scribbr剽18luck新利备用网登录窃检查程序

关于范围的常见问题

统计的范围是什么?

在统计数据,范围是分布中数据从最低值到最高值的分布。这是最简单的衡量可变性

范围可以是负数吗?

不。因为距离公式从最大的数字减去最小的数字,范围始终为零或正数。

四种主要的可变性度量是什么?

可变性最常见的测量方法是什么描述性统计:

集中倾向和可变性之间的区别是什么?

集中趋势告诉你大部分数据点在哪里,可变性总结了你们观点之间的距离。

数据集可能具有相同的集中趋势,但可变性水平不同,反之亦然。它们结合在一起,给你一个数据的完整画面。

这篇文章有用吗?
0
Pritha班达里

Pritha有英语、心理学和认知神经科学的学术背景。作为一名跨学科研究人员,她喜欢为学生和学者写文章解释棘手的研究概念。

1评论

Pritha班达里
Pritha Bhandari (Scribbr团队)
2020年9月11日下午2:21

感谢你的阅读!希望这篇文章对你有帮助。如果还有什么不清楚的,或者你没有在这里找到你想要的东西,请留下评论,我们会看看能否提供帮助。

仍然有问题吗?

请点击左边的复选框来确认你不是机器人。