统计 - 简单随机抽样
简单随机样本被定义为其中群体的每个元素具有被选择的相等和独立的机会。 在具有N个单元的群体的情况下,选择具有N个C n个子样本的所有可能组合的n个样本单元的概率由1 / N C n 例如 如果我们具有五个元素(A,B,C,D,E)的群体,即N 5,并且我们想要大小为n = 3的样本,则存在5个 = 10个可能的样本,任何单个单元作为样本成员的概率为1/10。
简单随机抽样可以以两种不同的方式进行,即“具有替换"或“不替换"。 当在下一次绘制之后更换所选择的单元之后将单元连续选择为样本时,它是具有替换的简单随机样本。 如果所选择的单元在下一次绘制之前不被替换,并且仅仅从总体的剩余单元进行连续单元,则其被称为无替换的简单随机采样。 因此,在前一种方法中,可以重复一次选择的单元,而在后一种方法中,不重复一次选择的单元。 由于与没有替换的简单随机样品相关的更多统计效率,其是优选的方法。
可以通过两个过程中的任一个,即通过抽彩方法或通过随机数表来绘制简单的随机样本。
-
彩票方法 - 在此方法下,基于随机抽取选择单位。 首先,向群体的每个成员或元素分配唯一的数字。 在下一步中,这些数字写在形状,大小,颜色等物理上相似的单独的卡上。然后将它们放在篮子中并充分混合。 在最后一步中,卡片被随机取出,而不看它们。 绘制的单据数量等于所需的样本数量。
彩票方法具有很少的缺点。 写入N个滑移的过程是麻烦的,并且混洗大量滑移,其中人口规模非常大,是困难的。 在选择票据时,人力偏见也可能进入。 因此,可以使用其他替代方式,即随机数。
-
随机数表方法 - 这些由随机准备的数字列组成。 随机表的数量例如 Fisher和Yates表,Tippets随机数等。下面列出了来自Fisher& Yates表:
61,44,46,76,23,57,58,54,11,33,86,07,26,75,76,64,22, 58,69,52,27,34,91,25,34,67,76,73,27,16,53,18,19,69,32,52,38,72,38,64,81,79及 38。
第一步骤涉及向群体的每个成员分配唯一的数字,例如 如果人口包括20人,则所有个人从01到20编号。如果我们要收集5个单位的样本,则参考随机数表5选择双位数字。 例如。 使用上述表格,具有以下五个数字的单元将形成一个样本:01,11,07,19和16.如果采样没有替换,并且特定的随机数重复自身,则不会再次采用,并且下一个数字 符合我们的标准将被选择。
因此,可以使用两个过程中的任一个来绘制简单的随机样本。 然而,在实践中,已经看到简单的随机样本涉及大量的时间和努力,并且是不切实际的。