统计 - 柯尔莫哥洛夫斯米尔诺夫测试
该测试用于必须在观察样品分布和理论分布之间进行比较的情况。
K-S一个样品测试
该试验用作适合性的试验,并且当样品的尺寸小时是理想的。 它将变量的累积分布函数与指定分布进行比较。 零假设假定观测值和理论分布之间没有差异,并且测试统计量的值“D"计算为:
式
$ D = Maximum | F_o(X)-F_r(X)| $
其中 -
$ {F_o(X)} $ =观察到的n个观测值的随机样本的累积频率分布。
和$ {F_o(X)= \\ frac {k} {n}} $ =(观测值数≤X)/(观测总数)。
$ {F_r(X)} $ =理论频率分布。
$ {D} $的临界值从一个样本测试的K-S表值中找到。
接受标准:如果计算值小于临界值,则接受零假设。
拒绝标准:如果计算值大于表值拒绝零假设。
例子
问题陈述:
在一所学院的各种流动的研究中,60名学生,从每个流中抽取相等数量的学生,我们被采访,他们打算加入大学戏剧俱乐部。
B.Sc. | B.A. | B.Com | 嘛。 | M.Com | |
---|---|---|---|---|---|
在每个类中 | 5 | 9 | 11 | 16 | 19 |
预计每班12名学生将加入戏剧俱乐部。 使用K-S测试来确定学生班级之间在加入戏剧俱乐部的意向上是否存在差异。
解决方案:
$ {H_o} $:不同流派的学生对于他们加入戏剧俱乐部的意图没有区别。
我们开发观测和理论分布的累积频率。
流 | 有意加入的学生人数 | $ {F_O(X)} $ | $ {F_T(X)} $ | $ {| F_O(X)-F_T(X)|} $ | |
---|---|---|---|---|---|
观察 (O) |
理论 (T) |
||||
B.Sc. | 5 | 12 | 5/60 | 12/60 | 7/60 |
B.A. | 9 | 12 | 14/60 | 24/60 | 10/60 |
B.COM。 | 11 | 12 | 25/60 | 36/60 | 11/60 |
嘛。 | 16 | 12 | 41/60 | 48/60 | 7/60 |
M.COM。 | 19 | 12 | 60/40 | 60/60 | 60/60 |
总 | n=60 | ||||
测试统计$ {| D |} $计算如下:
D在5%显着性水平的表值由下式给出
由于计算值大于临界值,因此我们拒绝零假设,并得出结论,不同流派的学生在他们加入俱乐部的意图上存在差异。
K-S两个样品测试
当代替一个时,有两个独立的样本,则K-S两个样本测试可以用于测试两个累积分布之间的一致性。 零假设表明两个分布之间没有差异。 以与K-S单样本测试相同的方式计算D-统计量。
式
$ {D = Maximum | {F_n} _1(X) - {F_n} _2(X)|} $
其中 -
$ {n_1} $ =第一个样本的观察结果。
$ {n_2} $ =第二个样本的观察结果。
已经看到,当累积分布显示大的最大偏差时,其指示两个样本分布之间的差异。
D的临界值对于$ {n_1 = n_2} $且≤40的样本,使用两个样本的K-S表。 当$ {n_1} $和/或$ {n_2} $> 40,则应使用两个样品测试的大样品的K-S表。 如果计算的值小于表值,则接受零假设,反之亦然。
因此,当目标人群的特征未知或没有对其进行假设时,使用任何这些非参数测试有助于研究人员测试他的结果的重要性。