抽样偏见:它是什么,为什么重要?
当某些成员的某些成员时,就会发生抽样偏见人口系统地比其他的更有可能在样本中被选择。这在医学领域也被称为查明性偏见。
抽样偏差限制了调查结果的普遍性,因为它是对外部效度,特别是人口有效性。换句话说,来自偏见样品的发现只能推广到与样品共享特征的群体。
抽样偏差的原因
你所选择的研究设计或数据收集方法可能导致抽样偏差。抽样偏差可以发生在概率抽样和非概率抽样中。
概率样本中的抽样偏差
在概率抽样,人口的每个成员都有已知的选择。例如,您可以使用随机数生成器来选择一个简单的随机样本来自你的人口。
虽然这一程序减少了抽样偏倚的风险,但它可能不能消除它。如果你的抽样框架——抽取样本的实际个体列表——与总体不匹配,这可能导致样本有偏差。
虽然你用的是随机样本,不是你大学的目标人口 - undergraduate学生的每个成员 - 有机会被选中。您的样本错过了任何未注册的人,这些人不会联系参与研究。这可能会让你的样本偏向那些具有较少社交焦虑并且更愿意参与研究的人。
非概率样本中的抽样偏差
一个non-probability样本是根据非随机标准选择的。例如,在一个便利样本中,根据可访问性和可用性选择参与者。
非概率抽样经常导致偏置样品,因为人口的某些成员更有可能包括于其他人。
因为这是一个方便样品,它不代表您的目标人口。乘坐这门课程的人可能更自由,并朝着大学的其他人吸引植物的食物。
抽样偏差的类型
类型 | 解释 | 例 |
---|---|---|
自我选择 | 具有特定性格的人比其他人更容易同意参加研究。 | 寻求更加刺激的人可能会参与痛苦的研究研究。这可能会歪斜数据。 |
情况说明 | 拒绝从研究中删除或辍学的人有所不同地与参与的人不同。 | 在对压力和工作量的研究中,具有高工作量的员工不太可能参加。由此产生的样品在工作量方面可能不会变化。 |
秘密 | 人口中的一些成员在样本中没有得到充分的代表。 | 在线管理普通国家调查可能会错过互联网接入有限的集团,例如老年人和低收入家庭。 |
生存 | 成功的观察,人和物体更有可能在样本中代表而不是不成功的人。 | 在科学期刊上,有很强的发表倾向于积极的结果。成功的研究结果发表的频率远高于无效的研究结果。 |
预审或广告 | 参与者的预先筛选方式或研究的宣传可能会使样本产生偏差。 | 当寻找志愿者来测试一种新的睡眠干预方法时,你可能会得到一个比其他人更有动力改善他们睡眠习惯的样本。因此,不管你的干预效果如何,他们都有可能改善自己的睡眠习惯。 |
健康的用户 | 预防干预志愿者比其他人群更有可能追求促进健康的行为和活动。 | 预防性干预中的样品具有更好的饮食,更高的身体活动水平,从酒精弃权,并避免吸烟超过大多数人口。实验结果可能是与样品的这些特征相互作用的治疗结果,而不是仅仅是治疗本身。 |
如何避免或纠正抽样偏见
使用仔细的研究设计和抽样程序可以帮助你避免抽样偏差。
- 定义一个目标人群和一个抽样框架(样本将从中抽取的个人名单)。尽可能将抽样框架与目标总体匹配,以降低抽样偏倚的风险。
- 在线制作调查尽可能短,可供选择。
- 跟进非响应者。
- 避免便利抽样。
为了避免偏差而进行过采样
过采样可用于避免在定义群体成员不足的情况下采样偏差(覆盖覆盖)。这是一种从某些群体中选择受访者的方法,使得它们构成比实际群体的更大的样本份额。
在收集完所有的数据后,从过采样组得到的回答将加权到他们在总体中所占的实际份额,以消除任何抽样偏差。
他们收集了一个国家代表性的样本,其中有1500名受访者,这是亚裔美国人的过度破坏。随机数拨号用于联系美国家庭,并取消较大的样本从更多亚裔美国人的地区取出。在1500名受访者中,336是亚裔美国人。根据这种样本规模,研究人员可以对亚洲美国人的调查结果充满信心。
加权是为了确保亚裔美国人的回答占总数的5.6%。这允许对整个样本进行准确的估计。
关于抽样偏见的常见问题
- 为什么抽样偏见重要?
-
抽样偏差对外部效度-它将你的发现的普遍性限制在更广泛的人群中。
- 抽样偏差有哪些类型?
-
一些常见的抽样偏差类型包括自我选择、无反应、覆盖不足、存活、预筛选或广告以及健康用户偏见。
- 为什么在研究中使用样本?
-
样品是用来做推论的人口。样本更容易收集数据,因为它们实用、经济、方便和易于管理。
1评论
Pritha bhandari(Scribbr队)
2020年5月20日下午4:57感谢你的阅读!希望这篇文章对你有帮助。如果还有什么不清楚的,或者你没有在这里找到你想要的东西,请留下评论,我们会看看能否提供帮助。