群集采样介绍
在集群抽样中,研究人员划分了一个人口进入较小的群体称为簇生。然后,它们随机选择这些簇中以形成样本。
群集采样是一种方法概率抽样这通常用于研究大的人群,特别是那些广泛地理位置分散的人群。研究人员通常使用预先存在的单位,例如学校或城市作为群集。
如何播放样本
最简单的群集采样形式是单级集群采样。它涉及4个关键步骤。
获得所有第七层的列表是非常困难的,并从整个城市的随机样品中收集数据。但是,您可以轻松获取所有学校的列表,并从这些子集中收集数据。因此,您决定使用群集采样方法。
第1步:定义你的人口
与其他形式的采样一样,您必须首先首先,清楚地定义您要学习的人口。
第2步:将样品划分为集群
这是该过程中最重要的部分。群集的质量以及它们代表更大的人口的程度决定了有效性你的结果。理想情况下,您希望您的集群满足以下标准:
- 每个集群的人口应尽可能多样化。您希望整个人口的每个潜在特征都在每个群集中表示。
- 每个集群应具有与整体人口分布相似的特征分布。
- 连同,集群应涵盖整个人口。
- 群集之间没有任何重叠(即,同一个人或单位不出现在多个群集中)。
理想情况下,每个群集都应该是整个人口的迷你代表性。但是,在实践中,集群通常不会完美地代表人口的特征,这就是为什么这种方法提供较少的统计确定性简单的随机抽样。
因为群集通常是天然存在的群体,如学校,城市或家庭,他们通常比整个人口更加友好。在进行学习时,您应该意识到这一点,因为它可能会影响其有效性。
第3步:随机选择要用作为样本的群集
如果每个群集本身是较大的人口的迷你表示,则从群集中随机选择和采样允许您模仿简单的随机采样,这反过来支持结果的有效性。
相反,如果群集不是代表性,则随机采样将允许您收集各种集群中的数据,这仍应为您提供整个人口的概述。
您根据您希望样本大小的大量选择群集数。这反过来是基于整个七年级人口的估计大小,您的所需置信区间和置信水平,以及你最好的猜测标准偏差(衡量第七年级学生的阅读水平的人口中的价值观如何分散。
然后你用一个样本大小计算器估计所需的样本大小。
第4步:从样本中收集数据
然后,您进行学习并从所选集群中的每个单元收集数据。
多级集群采样
在多级聚类而不是从所选群集中的每个单个单元收集数据,而不是从所选群集中的每个单元中收集数据,而是随机选择从群集中的单个单位以用作样本。
然后,您可以从每个单位单元中收集数据 - 这被称为双级抽样。
您还可以继续执行此过程,逐渐较小,随机样本较小,通常被称为多级抽样。
当测试整个群集时,您应该在不可行或太昂贵时使用此方法。
- 从每所学校,您随机选择第七级课程的样本。
- 从这些类中,您随机选择一个学生的样本。
得到的样本要小得多,因此更容易收集数据。
的优点和缺点
群集采样通常用于其实际优势,但它在统计有效性方面存在一些缺点。
优点
- 群集采样是时间和成本效益的,特别是对于广泛地理位置的样品,否则难以正确地样本。
- 由于群集采样使用随机化,因为群体群集正确,您的研究将具有高度外部有效性因为您的样本将反映人口较大的特征。
缺点
- 内部有效性与简单的随机抽样不太强,特别是在您使用更多的聚类阶段时。
- 如果您的群集不是整体人口的良好迷你表达,那么依靠您的样本更难以提供有效的结果。
- 比其他形式的抽样计划更复杂。
关于集群采样的常见问题
- 群集采样类型是什么?
-
有三种类型的整群抽样:单级,双级和多级聚类。在所有三种类型中,您首先将人口划分为群集,然后随机选择用于样本的集群。
- 在单级抽样,您从所选群集中的每个单元收集数据。
- 在双级抽样,您可以从群集内选择一个单位的随机样本。
- 在多级抽样,您重复从群集内部的随机采样元素的过程,直到您达到可管理的示例大小。
1条评论
Lauren Thomas(Scribbr队)
9月7日,2020年晚上9:38谢谢阅读!希望你发现这篇文章有用。如果有的话尚不清楚,或者如果你没有找到你在这里寻找的东西,请留下评论,我们会看看我们是否可以提供帮助。