统计 - 分层抽样
这种用于检查的策略被用作环境的一部分,其中群体可以毫不费力地分割成彼此特别不相同的集合或层,但是集合内部的组件对于几个属性是同类的。 G。 学校的学习可以在性取向,提供的课程,年龄等前提下分成阶层。 在此,群体最初被分成层,之后从每个层取得基本的不规则标本。 分层测试有两种类型:成比例的分层检查和不成比例的分层检查。
-
比例分层抽样 - 在此,从每个层选择的单位数量与层中的份额成比例。 在一所大学有2500名学生,其中1500名学生注册研究生课程,1000名注册研究生课程。 如果要使用成比例的分层抽样来选择样本100,那么样本中的本科生的数量将是60,并且40个是研究生。 因此,两个层在样本中以与它们在群体中的表示相同的比例表示。
当抽样的目的是估计一些特征的人口值,并且层内方差没有差异时,这种方法是最合适的。
-
不成比例的分层抽样 - 当研究的目的是比较各层之间的差异时,就必须从所有层中抽取相等的单位,而不考虑它们在人口中的份额。 有时,某些层相对于某些特征比其他层更可变,在这种情况下,可以从更可变的层中抽取更多数量的单元。 在这两种情况下,抽取的样本是不成比例的分层样本。
可以使用以下公式来最佳地分配层大小和层变异性的差异,以从不同层确定样本大小
式
$ {n_i = \\ frac {n.n_i \\ sigma_i} {n_1 \\ sigma_1 + n_2 \\ sigma_2 + ... + n_k \\ sigma_k} \\ for \\ i = 1,2 ... k} $
其中 -
$ {n_i} $ = i strata的样本大小。
$ {n} $ = strata的大小。
$ {\\ sigma_1} $ = i strata的标准偏差。
除此之外,可能存在这样的情况,其中收集样品的成本可能在一个层次比在其他层次更多。 最佳不成比例抽样应该以这样的方式进行
$ {\\ frac {n_1} {n_1 \\ sigma_1 \\ sqrt {c_1}} = \\ frac {n_2} {n_2 \\ sigma_1 \\ sqrt {c_2}} = ... = \\ frac {n_k} {n_k \\ sigma_k \\ sqrt { c_k}}} $
其中$ {c_1,c_2,...,c_k} $指的是k层中的采样成本。 来自不同层的样本量可以使用以下公式确定:
$ {n_i = \\ frac {\\ frac {n.n_i \\ sigma_i} {\\ sqrt {c_i}}} {\\ frac {n_1 \\ sigma_1} {\\ sqrt {c_i}} + \\ frac {n_2 \\ sigma_2} {\\ sqrt {c_2}} + ... + \\ frac {n_k \\ sigma_k} {\\ sqrt {c_k}}} for \\ i = 1,2 ... k} $
例子
问题陈述:
一个组织有5000名员工,分为三个层次。
A层:50名高管,标准差= 9
阶层B:1250个非手工工人,标准偏差= 4
层C:3700个标准偏差= 1的人工
如何抽样300名员工,在不合比例的基础上进行最佳配置?
解决方案:
使用不成比例抽样的公式进行最优分配。