统计 - 区间估计
间隔估计是使用样本数据来计算未知总体参数的可能(或可能)值的区间,与作为单个数字的点估计相反。
式
$ {\\ mu = \\ bar x \\ pm Z _ {\\ frac {\\ alpha} {2}} \\ frac {\\ sigma} {\\ sqrt n}} $
其中 -
$ {\\ bar x} $ = mean
$ {Z _ {\\ frac {\\ alpha} {2}}} $ =置信系数
$ {\\ alpha} $ =置信水平
$ {\\ sigma} $ =标准差
$ {n} $ =样本大小
例子
问题陈述:
假设测量某种液体的沸腾温度的学生在6个不同的液体样品上观察到读数(以摄氏度计)102.5,101.7,103.1,100.9,100.5和102.2。 他计算样本均值为101.82。 如果他知道这个程序的标准偏差是1.2度,那么在95%置信水平下,人口平均值的区间估计是多少?
解决方案:
学生计算沸腾温度的样本平均值为101.82,标准偏差为$ {\\ sigma = 0.49} $。 95%置信区间的临界值为1.96,其中$ {\\ frac {1-0.95} {2} = 0.025} $。 未知均值的95%置信区间。
随着置信水平降低,相应间隔的大小将减小。 假设学生对沸腾温度的90%置信区间感兴趣。 在这种情况下,$ {\\ sigma = 0.90} $和$ {\\ frac {1-0.90} {2} = 0.05} $。 此级别的临界值等于1.645,因此90%置信区间为
样本量的增加将降低置信区间的长度,而不降低置信水平。 这是因为标准偏差随着n增加而减小。
误差范围
间隔估计的误差界限$ {m} $被定义为从确定间隔长度的样本平均值增加或减去的值:
$ {Z _ {\\ frac {\\ alpha} {2}} \\ frac {\\ sigma} {\\ sqrt n}} $
假设在上面的例子中,学生希望有95%置信度的误差界限等于0.5。 将适当的值替换为$ {m} $的表达式并求解n给出计算。
为了实现对总长度小于1度的平均沸点的95%间隔估计,学生将必须进行23次测量。