序号数据:示例,集合和分析

顺序数据被分类为具有自然等级令的变量中的类别。但是,类别之间的距离不均匀或未知。

例如,变量“体育锻炼的频率”可以分为以下几类:

1.永远 很少 3.有时 4.经常 5.总是

这些类别有一个明确的顺序,但我们不能说“从不”和“很少”之间的区别与“有时”和“经常”之间的区别完全相同。因此,这个量表是有序的。

水平的测量

序数是4个层次的第二个水平的测量:标称,序数,间隔和比例。测量水平表示如何记录数据。

而名义变量和顺序变量是分类,间隔和比变量是定量的。

测量的四个层次:标称,序数,间隔和比率

名义数据与序数数据不同,因为它不能按顺序排列。间隔数据与序数数据不同,因为相邻得分之间的差异是相等的。

序数尺度的例子

在社会科学研究中,序数变量通常包括关于意见或感知的评级,或分类为水平或括号(如社会地位或收入)的人口因子。

变量 序数值
语言能力
  • 初学者
  • 中间
  • 流利的
级别的协议
  • 强烈反对
  • 不同意
  • 既不赞成也不反对
  • 同意
  • 强烈同意
收入水平
  • 较低级别的收入
  • 中级收入
  • 较高级别收入

你的抄袭分数是多少?

将您的论文与超过6000亿网络页和3000万个出版物进行比较。

  • 2020年18luck新利备用网登录最佳剽窃检查员
  • 剽窃报告及百分比
  • 最大的抄袭数据库

Scribbr剽18luck新利备用网登录窃检查程序

如何收集序数数据

通常使用封闭端评估序数变量民意调查给参与者几个可能的答案可供选择的问题。这些都是用户友好的,可以让您轻松地比较参与者之间的数据。

序数调查问题的例子
选项
你几岁?
  • 0-18
  • 19-34
  • 35-49
  • 50+
你的教育程度是多少?
  • 小学
  • 高中
  • 学士学位
  • 硕士
  • 博士学位
在过去的三个月里,你有多少次在网上买东西?
  • 没有一个
  • 1-4次
  • 5-9次
  • 10-14次
  • 15次或以上

选择测量水平

某些类型的数据可以在多个级别上录制。例如,对于年龄的变量:

  • 如上述问题所示,你可以通过让参与者从四个年龄区间中选择来收集顺序数据。
  • 你可以收集比率数据通过向参与者询问他们的确切年龄。

对于收集数据,更精确的级别总是更好的,因为它允许您执行更多的数学操作和统计分析。

李克特缩放数据

在社会科学中,经常使用序数数据李克特量表.李克特量表由4个或多个李克特类型问题组成,与参与者的响应项的连续值是可供选择的。

李克特类型问题的例子
您如何购买节能产品?
绝不 很少 有时 经常 总是
你认为减少碳足迹有多重要?
不重要 略显重要 重要的 中等重要 很重要

由于这些值具有自然顺序,因此它们有时被编码为数值。例如,1 =从不,2 =很少,3 =有时,4 =通常,5 =始终。

但重要的是要注意,并非所有数学操作都可以对这些数字进行。虽然您可以说数据集中的两个值是相等或不等的(=或≠),或者一个值更大或更少或小于另一个(<或>),但您不能有意义地添加或减去彼此的值。

当收集有关您的数据的描述性统计数据时,这变得相关。

如何分析序数数据

可以通过描述性和推理统计分析序数数据。

描述性统计

你可以使用这些描述性统计顺序数据:

例子
您要求30次调查参与者与以下声明表示其协议水平:

定期体育锻炼对我的心理健康很重要。
强烈反对 不同意 既不同意也不同意 同意 强烈同意

要获得数据的概览,可以创建一个频率分布表,告诉您每个响应被选择了多少次。

示例:频率分布表
协议水平 频率
强烈反对 2
不同意 2
既不同意也不同意 8.
同意 13.
强烈同意 5.

要可视化您的数据,您可以在条形图上呈现它。在X轴上绘制您的类别和Y轴上的频率。

与标称数据不同,类别的顺序在显示序数数据时。

示例:条形图
在条形图上可视化顺序数据

集中趋势

集中趋势您的数据集是您的大部分值的位置。模式,平均值和中位数是三种最常用的中央趋势措施。

虽然这吧模式几乎总是可以找到序数数据,中位数只有在某些情况下才能找到。

均值不能用序数数据计算。找到的意思是要求您执行数据集中的值的添加和划分等算术运算。由于相邻分数之间的差异未知在序数数据,因此无法对有意义的结果执行这些操作。

示例:找到模式
数据的模式是最常见的出现值。

在当前数据集中,模式是同意

以不同方式找到奇数和偶数数据集的中位数。

  • 在奇数数据集中,中位数是排名时数据集的中间的值。
  • 在均匀的数据集中,中值是数据集中中间的两个值的平均值。
示例:找到中位数
订购所有数据值并找到数据集的中间以查找中位数。

由于有30个值,第15个位置中的中间有2个值。这两个值都是相同的,所以中位数是同意

现在,假设中间的两个值同意并强烈同意。您如何找到这两个值的含义?

因为不能进行加法或除法,所以即使对这两个值进行数字编码,也无法找到它们的平均值。这里没有中位数。

变化性

评估可变性您的数据集,您可以找到最小,最大和范围。您需要以数字方式代码这些数据。

示例:找到范围
首先,通过将数字分配给每个响应来代码数据,按顺序从最低到最高:

  • 1 =不同意
  • 2 =不同意
  • 既不同意也不同意
  • 4 =同意
  • 5 =非常同意

要找到最小和最大值,请查找数据集中出现的最低值和最高值。最小值为1,最大值为5。

对于范围,从最大值中减去最小值:

范围= 5 - 1 =4.

该范围为您提​​供了一个普遍的分数彼此差异的概念。根据这些信息,您可以得出结论至少在规模的任一端至少有一个答案。

统计测试

推论统计帮助你测试关于你的数据的科学假设。最合适的统计测试对于序数数据,专注于测量的排名。这些是非参数化测试。

当您的数据满足某些标准时,使用参数测试,如a正常分布.参数测试评估手段,而非参数测试通常评估中位数或等级。

您可以使用许多可能的统计测试,您可以使用序数数据。您选择哪一个取决于您的目标和样本的数量和类型。

非参数测试 目的 样本或变量 例子
情绪中位测试 比较中位数 2个或更多样品 2个邻近城市中位数的中位数收入水平如何?
曼恩惠特尼检验(Wilcoxon秩和检验) 比较分数排名的总和 两个独立样本 一个城市的感知社会地位如何与另一个城市的社会地位不同?
Wilcoxon匹配对签名 - 等级测试 比较分数分布差异的幅度和方向 2相关的样品 民主党人和共和党人在同一个城市的分布程度如何?
kruskal-wallis.H测试 比较分数的平均排名 3个或更多样品 民主党人、共和党人和无党派人士对社会地位的看法有何不同?
Spearman的RHO或秩相关系数 关联2个变量 2个序数变量 收入水平与感知的社会地位相关吗?

关于有序数据的常见问题

什么是有序数据?

顺序数据有两个特点:

  • 在一个变量内,数据可以被分为不同的类别。
  • 类别有自然排名的订单。

但是,与间隔数据不同,类别之间的距离是不均匀或未知的。

四个测量水平是多少?

水平的测量告诉您如何准确记录变量。有4个测量级别,可以从低到高点排列:

  • 义务数据只能进行分类。
  • 序号数据可以分类和排序。
  • 间隔数据可以分类和排序,均匀间隔。
  • 数据可以分类,排名,均匀间隔,并且具有自然零。
标称数据和序数数据有什么区别?

名词性和序数是四种语言中的两种水平的测量名义级别数据只能分类,而序数水平数据可以分类和订购。

是序数变量分类或量化吗?

在统计数据,序号义务变量都被认为分类变量

尽管序数数据有时可以是数值,但并非所有数学操作都可以对它们进行。

李克特级序数或间隔秤吗?

一般会考虑个别李克特类型的问题顺序数据,因为物品具有清晰的排序顺序,但没有均匀的分布。

总体利开特式量表分数有时被视为间隔数据。这些分数被认为具有方向性甚至它们之间的间隔。

数据类型确定了什么统计测试您应该用来分析您的数据。

这篇文章有用吗?
0.
Pritha班达里

Pritha有一个英语,心理学和认知神经科学的学术背景。作为一个跨学科研究员,她喜欢写文章,了解学生和学者的棘手研究概念。

1条评论

Pritha班达里
Pritha Bhandari (Scribbr队)
2020年8月12日晚8点21分

谢谢阅读!希望你发现这篇文章有用。如果有的话尚不清楚,或者如果你没有找到你在这里寻找的东西,请留下评论,我们会看看我们是否可以提供帮助。

仍然有问题吗?

请单击左侧的复选框以验证您是不是机器人。