codecamp

统计数据 - 所需的样本量

测试的关键部分是测试测量的选择,即从民众中选择用于完成勘探的单元的数量。 没有明确的答案或答案来表征最合适的大小。 有关测试跨度的确定的误导性判断,例如该示例应该是人口的10%,或者样本大小是相对于宇宙的程度。 然而,如前所述,这些只是误导性的判断。 样本应该是多广泛的是在研究的人口参数的品种的能力和专家所需的评估的准确性。

可以从两个角度接近样品的最佳尺寸的决定, 主观和数学。

  1. 确定样品量的主观方法

  2. 样本量确定的数学方法

确定样品量的主观方法

样品尺寸的选择受以下讨论的各种因素的影响:

  • 人口性质 - 同质性或异质性的水平影响样本的程度。 在人们对感兴趣的品质是均质的机会不大的情况下,甚至一个小尺寸的样本是足够的。 然而,如果民众是异质的,那么将需要更大的例子来保证充分的代表性。

  • 受访者的性质 - 如果受访者可轻松访问和可用,那么可以从一个小例子获取所需的数据。 尽管如此,尽管受访者不合作,并且非反应依赖于高,则需要更大的样品。

  • 研究的性质 - 可以利用一个实质性的例子来指导一次性研究。 如果应该出现具有恒定性质并且要认真完成的考试研究,那么一个小标本就更合适,因为它很难在长时间的罗盘上监督和持有一个例子。

  • 使用的采样技术 - 影响测试跨度的一个重要变量是接收的检查系统。 首先,非似然系统需要比似然策略更大的样本。 除了可能性测试内,如果使用简单的不规则检查,它需要一个更大的例子,如果使用分层,其中一个小的标本是适当的。

  • 表格的复杂性 - 在确定样本估计值时,专家应同样考虑发现要汇编和分解的分类和类别的数量。 已经看到,要产生的分类的数量越多,示例尺寸越大。 由于每一类都应该足够,所以需要更大的样本来给出最小分类的坚实测量。

  • 资源的可用性 - 资产和专家可访问的时间影响测试范围。 考试是一个期间和现金升级的任务,具有仪器准备,签约和准备现场工作人员,运输成本等等相当大量的资产的练习。 随后,如果科学家没有足够的时间和支持可及性,他将解决一个小例子。

  • 所需的精度和精度 - 。 从我们以前的话语中可以清楚地看出,通过标准错误测量的准确度将会很高,只要S.E较小或示例尺寸是实质性的。

此外,为了获得高水平的精度,需要更大的样品。 除了这些主观努力,样本量也可以数学确定。

样本量确定的数学方法

在样本大小确定的数学方法中,首先规定所需估计的精度,然后计算样本大小。 精度可以被指定为具有99%置信水平的真实平均值的$ {\\ pm} $ 1。 这意味着如果样本平均值是200,那么平均值的真实值将在199和201之间。这个精度水平由术语“c"

平均值样本大小确定。

宇宙平均值的置信区间由下式给出

$ {\\ bar x \\ pm Z \\ frac {\\ sigma_p} {\\ sqrt N} \\或\\ \\ bar x \\ pm e} $

其中 -

  • $ {\\ bar x} $ =样本均值

  • $ {e} $ =可接受的错误

  • $ {Z} $ =给定置信水平下标准正态变量的值

  • $ {\\ sigma_p} $ =总体的标准偏差

  • $ {n} $ =样本大小

可接受的误差\'e\',即$ {\\ mu} $和$ {\\ bar x} $之间的差由下式给出

$ {z. \\ frac {\\ sigma_p} {\\ sqrt N}} $

因此,样本的大小是:

$ {n = \\ frac {Z ^ 2 {\\ sigma_p} ^ 2} {e ^ 2}} $

要么

如果样本规模与人口规模相比有显着差异,那么上述公式将通过有限群体乘数来校正。

$ {n = \\ frac {Z ^ 2.N。{\\ sigma_p} ^ 2} {(N-1)e ^ 2 + Z ^ 2。{\\ sigma_p} ^ 2}} $

其中 -

  • $ {N} $ =总体大小

比例的样本大小确定

用于在估计比例时确定样本大小的方法与用于估计平均值的方法保持相同。 宇宙比例$ {\\ hat p} $的置信区间由

$ {p \\ pm Z. \\ sqrt {\\ frac {p.q} {n}}} $

其中 -

  • $ {p} $ =样本比例

  • $ {q =(1-p)} $

  • $ {Z} $ =样本比例的标准正态变量的值

  • $ {n} $ =样本大小

由于要估计$ {\\ hat p} $,因此p的值可以通过取p = 0.5的值(可接受的值,给出保守的样本大小)来确定。 另一个选择是通过试点研究或个人判断来估计p的值。 给定p的值,可接受误差“e"由下式给出

${ e= Z. \sqrt{\frac{p.q}{n}} \\[7pt] e^2 = Z^2\frac{p.q}{n} \\[7pt] n = \frac{Z^2.p.q}{e^2}}$

在人口有限的情况下,上述公式将由有限人口乘数校正。

${n = \frac{Z^2.p.q.N}{e^2(N-1) + Z^2.p.q}}$

例子

问题陈述:

购物商店有兴趣估计拥有商店优惠会员卡的家庭的比例。 以前的研究表明,59%的家庭有商店信用卡。 在95%置信水平,可容忍的误差水平为05。

  1. 确定进行研究所需的样本量。

  2. 如果目标家庭的数量已知为1000,那么样本量是多少?

解决方案:

商店具有以下信息

${ p = .59 \\[7pt] \Rightarrow q = (1-p) = (1-.59) =.41 \\[7pt] CL = .95 \\[7pt] And\ the\ Z\ standard\ variate\ for\ CL\ .95\ is\ 1.96 \\[7pt] e = \pm .05 }$

样本量可以通过应用以下公式确定:

${n = \frac{Z^2.p.q}{e^2}}$
${n = \frac{(1.96)^2.(.59).(.41)}{(.05)^2} \\[7pt] = \frac{.9226}{.0025} \\[7pt] = 369 }$

因此,369个家庭的样本足以进行研究。

由于人口,即目标住户已知为1000,而上述样本是总人口的很大比例,因此使用包括有限人口乘数的校正公式。

${n = \frac{Z^2.p.q.N}{e^2(N-1) + Z^2.p.q} \\[7pt] = \frac{(1.96)^2.(.59).(.41).(1000)}{(.05)^2 \times 999 + (1.96)^2(.59)(.41)} \\[7pt] = \frac{922.6}{2.497 + .922} \\[7pt] = 270 }$

因此,如果人口是有1000个家庭的有限的人口,那么进行研究所需的样本量是270。

从该图可以看出,如果群体大小是已知的,则确定的样本大小在大小上减小。


统计 - 茎叶情节
统计 - 分层抽样
温馨提示
下载编程狮App,免费阅读超1000+编程语言教程
取消
确定
目录

Statistics Tutorial

Statistics Useful Resources

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }