codecamp

统计 - 分层抽样

这种用于检查的策略被用作环境的一部分,其中群体可以毫不费力地分割成彼此特别不相同的集合或层,但是集合内部的组件对于几个属性是同类的。 G。 学校的学习可以在性取向,提供的课程,年龄等前提下分成阶层。 在此,群体最初被分成层,之后从每个层取得基本的不规则标本。 分层测试有两种类型:成比例的分层检查和不成比例的分层检查。

  • 比例分层抽样 - 在此,从每个层选择的单位数量与层中的份额成比例。 在一所大学有2500名学生,其中1500名学生注册研究生课程,1000名注册研究生课程。 如果要使用成比例的分层抽样来选择样本100,那么样本中的本科生的数量将是60,并且40个是研究生。 因此,两个层在样本中以与它们在群体中的表示相同的比例表示。

    当抽样的目的是估计一些特征的人口值,并且层内方差没有差异时,这种方法是最合适的。

  • 不成比例的分层抽样 - 当研究的目的是比较各层之间的差异时,就必须从所有层中抽取相等的单位,而不考虑它们在人口中的份额。 有时,某些层相对于某些特征比其他层更可变,在这种情况下,可以从更可变的层中抽取更多数量的单元。 在这两种情况下,抽取的样本是不成比例的分层样本。

    可以使用以下公式来最佳地分配层大小和层变异性的差异,以从不同层确定样本大小

    $ {n_i = \\ frac {n.n_i \\ sigma_i} {n_1 \\ sigma_1 + n_2 \\ sigma_2 + ... + n_k \\ sigma_k} \\ for \\ i = 1,2 ... k} $

    其中 -

    • $ {n_i} $ = i strata的样本大小。

    • $ {n} $ = strata的大小。

    • $ {\\ sigma_1} $ = i strata的标准偏差。

    除此之外,可能存在这样的情况,其中收集样品的成本可能在一个层次比在其他层次更多。 最佳不成比例抽样应该以这样的方式进行

    $ {\\ frac {n_1} {n_1 \\ sigma_1 \\ sqrt {c_1}} = \\ frac {n_2} {n_2 \\ sigma_1 \\ sqrt {c_2}} = ... = \\ frac {n_k} {n_k \\ sigma_k \\ sqrt { c_k}}} $

    其中$ {c_1,c_2,...,c_k} $指的是k层中的采样成本。 来自不同层的样本量可以使用以下公式确定:

    $ {n_i = \\ frac {\\ frac {n.n_i \\ sigma_i} {\\ sqrt {c_i}}} {\\ frac {n_1 \\ sigma_1} {\\ sqrt {c_i}} + \\ frac {n_2 \\ sigma_2} {\\ sqrt {c_2}} + ... + \\ frac {n_k \\ sigma_k} {\\ sqrt {c_k}}} for \\ i = 1,2 ... k} $

例子

问题陈述:

一个组织有5000名员工,分为三个层次。

  • A层:50名高管,标准差= 9

  • 阶层B:1250个非手工工人,标准偏差= 4

  • 层C:3700个标准偏差= 1的人工

如何抽样300名员工,在不合比例的基础上进行最佳配置?

解决方案:

使用不成比例抽样的公式进行最优分配。

${n_i = \frac{n.n_i\sigma_i}{n_1\sigma_1+n_2\sigma_2+n_3\sigma_3}} \\[7pt] \, For Stream A, {n_1 = \frac{300(50)(9)}{(50)(9)+(1250)(4)+(3700)(1)}} \\[7pt] \, = {\frac{135000}{1950} = {14.75}\ or\ say\ {15}} \\[7pt] \, For Stream B, {n_1 = \frac{300(1250)(4)}{(50)(9)+(1250)(4)+(3700)(1)}} \\[7pt] \, = {\frac{150000}{1950} = {163.93}\ or\ say\ {167}} \\[7pt] \, For Stream C, {n_1 = \frac{300(3700)(1)}{(50)(9)+(1250)(4)+(3700)(1)}} \\[7pt] \, = {\frac{110000}{1950} = {121.3}\ or\ say\ {121}}$

统计数据 - 所需的样本量
统计 - 残差平方
温馨提示
下载编程狮App,免费阅读超1000+编程语言教程
取消
确定
目录

Statistics Tutorial

Statistics Useful Resources

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }