了解变量类型

在统计研究中,变量被定义为研究对象的属性。选择要测量的变量是良好的核心实验设计

例子

如果你想测试一些植物物种是否比其他的更耐盐,你可能会测量一些关键的变量,包括大量的盐你往水里加入种植物正在研究,与植物健康有关的变量增长枯萎

您需要知道要使用哪些类型的变量,以便选择合适的变量统计测试并解释你的研究结果。

你通常可以通过问两个问题来确定变量的类型:

  1. 变量包含什么类型的数据?
  2. 该变量代表实验的哪一部分?

数据类型:定量VS分类变量

数据是变量的特定测量 - 它是您在数据表中记录的值。数据通常分为两类:

  • 定量数据代表金额。
  • 分类数据代表分组。

包含定量数据的变量是定量变量;包含分类数据的变量是一个分类变量.每一种类型的变量都可以被分解成进一步的类型。

定量变量

当你收集定量数据时,你所记录的数字代表的是可加、可减、可除等的实际数量。定量变量有两种类型:离散连续

离散变量与连续变量
变量类型 这些数据代表什么? 例子
离散变量(又名整数变量) 单个项目或值的计数。
  • 一个班级的学生人数
  • 森林中不同树种的数量
连续变量(AKA比变量) 连续或非有限值的测量。
  • 距离
  • 体积
  • 年龄

分类变量

分类变量代表某种分组。它们有时被记录为数字,但数字代表类别而不是实际数量。

分类变量有三种类型:二进制名义上的,序数变量。

二进制变量,名义变量,序数变量
变量类型 这些数据代表什么? 例子
二元变量(AKA二分变量) 是的/不结果。
  • 抛硬币时正面/反面
  • 在足球比赛中赢/输
名义变量 组之间没有等级或顺序。
  • 物种名称
  • 颜色
  • 品牌
序数变量 以特定顺序排列的组。
  • 在比赛中获得最后一名
  • 在调查中评定量表的反应*

*请注意,有时变量可以像多种类型一样工作!如果比例为数字,则序列变量也可以用作定量变量,并且不需要保留为离散整数。例如,产品评论的星级评级是序数(1至5星),但平均星级是定量的。

示例数据表

为了跟踪盐水实验,您可以在其中记录实验中的变量的信息,如盐添加和植物健康。

为了收集植物随时间变化的反应信息,你可以每隔几天填写相同的数据表,直到实验结束。这个示例表格根据变量的类型进行了颜色编码:名义上的连续序数,二进制

显示植物耐盐实验中变量类型的数据表示例

实验的一部分:自变量与因变量

实验通常旨在了解一个变量对另一个变量的影响 - 在我们的例子中,盐添加对植物生长的影响。

你操作独立变量(你认为可能是导致),然后测量依赖变量(你认为可能是效果)来找出这种影响可能是什么。

您可能还有持续的变量(控制变量),以便集中精力进行实验性治疗。

独立的VS依赖于VS控制变量
变量类型 定义 例(盐耐盐实验)
独立变量(AKA治疗变量) 为了影响实验结果而操纵的变量。 每棵植物的水中所加入的盐的量。
因变量(即响应变量) 代表实验结果的变量。 任何植物健康和生长的测量:在这种情况下,植物高度和枯萎。
控制变量 在整个实验中保持恒定的变量。 植物所在的房间的温度和光线,以及给每一株植物的水量。

示例数据表

在这个实验中,我们有一个独立的和三个依赖变量。

纸张中的其他变量不能被分类为独立或依赖,但它们确实包含您需要的数据,以便解释您的依赖和独立变量。

说明植物耐盐试验的因变量和自变量的数据表示例。

那相关研究呢?

当你做相关研究,术语“依赖”和“独立”不适用,因为您没有尝试建立一个原因和效果关系。

然而,在某些情况下,可能会出现一个变量明显先于另一个变量的情况(例如,降雨导致泥浆,而不是相反)。在这些情况下,您可以调用前面的变量(即降雨量)预测变量下面的变量(即泥浆)是结果变量

你的剽窃分数是多少?

把你的论文和超过600亿个网页和3000万份出版物进行比较。

  • 2020年18luck新利备用网登录最佳剽窃检查器
  • 剽窃报告及百分比
  • 最大剽窃数据库

Scribbr剽18luck新利备用网登录窃检查程序

其他常见类型的变量

一旦你定义了你的自变量和因变量,并确定了它们是分类的还是定量的,你就能够选择正确的统计检验

但是还有很多其他的方法来描述变量,这有助于解释你的结果。下面列出了一些有用的变量类型。

变量类型 定义 例(盐耐盐实验)
混淆变量 这个变量隐藏了实验中另一个变量的真实效果。当另一个变量与你感兴趣的变量密切相关,但你没有在实验中控制它时,这种情况就会发生。 盆栽大小和土壤类型对植物生存的影响可能与盐的添加量一样或更多。在一个实验中,你可以通过保持这些潜在的干扰因素不变来控制它们。
潜在的变量 一个不能直接测量,但可以通过代理表示的变量。 植物中的耐盐不能直接测量,但可以从我们的盐添加实验中的植物健康测量推断出来。
复合变量 在实验中把多个变量组合在一起而形成的变量。这些变量是在分析数据时产生的,而不是在测量数据时产生的。 这三个植物健康变量可以合并成一个单一的植物健康得分,使它更容易呈现您的发现。

关于变量的常见问题

什么是独立和依赖的变量?

你可以从因果关系的角度来考虑自变量和因变量独立变量变量你认为是的导致,虽然依赖变量是效果

在实验中,您可以操纵独立变量并测量从属变量中的结果。例如,在实验中,关于营养成分对作物生长的影响:

  • 独立变量是向农田中添加的营养物质的量。
  • 依赖变量是收获时间的庄稼的生物量。

定义您的变量,并决定如何操纵和测量它们,这是一个重要的部分实验设计

什么是混淆变量?

一个混乱的变量,也被称为混淆因素或混淆因素,是第三种变量在一项调查潜在因果关系的研究中。

混淆变量与假设的研究原因和假设的研究效果有关。这可能很难区分真正的影响独立变量从混杂变量的影响。

在你的研究设计在美国,重要的是要确定潜在的混淆变量,并计划如何减少它们的影响。

定量变量和分类变量的区别是什么?

定量变量数据表示金额的任何变量(例如高度,重量或年龄)。

分类变量数据表示组的任何变量。这包括排名(例如,比赛的整理场所),分类(例如谷物品牌)和二元成果(例如硬币翻转)。

你需要知道是什么变量类型你要为你的数据选择正确的统计测试并解释你的数据结果

离散变量和连续变量的区别是什么?

离散变量和连续变量是两种类型定量变量

  • 离散变量表示计数(例如,集合中对象的数量)。
  • 连续变量表示可测量的量(如水的体积或重量)。
这篇文章有用吗?
5.
丽贝卡·贝

丽贝卡正在攻读土壤生态学博士学位,空闲时间用来写作。她很高兴能和你们大家一起呆在统计学上。

5个评论

洗巴
2021年1月22日下午6点52分

你好,
每项研究中都必须有因变量和自变量吗?例如,如果我们想要比较运动员的体重和正常人群的体重,因变量和自变量是什么?
谢谢。

回复

修纳人麦库姆
Shona McCombes(Scribbr团队)
2021年1月27日晚上9点35分

嗨洗巴,

不,不是每个研究都有自变量和因变量;当您想要测试一个变量对另一个变量的影响时,这些术语适用。

其他类型的研究有时使用其他术语,如预测和结果变量或解释和反应变量。在你的例子中,我们可能会说“体重”是结果变量,而“运动员状态”(即运动员或非运动员)是预测变量。

回复

约翰
3月27日,2020年上午8:30

自变量和调节变量的区别是什么?

我们是否可以这样说,植物物种是独立的,而盐的加入是调节变量?由于不同的植物种类在因变量部分给出了不同的结果。说植物物种也是一个自变量合适吗?

谢谢你。

回复

约翰
2020年3月27日上午9:16

抱歉,我指的是调节变量如植物种类和独立变量如Salt添加的。

这种方式适合吗?

回复

修纳人麦库姆
Shona McCombes(Scribbr团队)
2020年3月30日下午6:44

你好,约翰,

是的,在这个例子中,你是对的,植物物种是一个调节变量。

在实验中,独立变量是您直接操纵的变量(在这种情况下,添加的盐量)。培养变量是您衡量的变量,因为它可能会影响独立变量如何在从属变量上行动,但您不直接操作(在这种情况下,工厂物种)。您可以在我们的文章中阅读更多培养变量

希望会有帮助!

回复

仍然有问题吗?

请单击左侧的复选框以验证您是不是机器人。