codecamp

统计数据 - 峰度

通过峰度测量平坦度或峰值度。 它告诉我们分布相对于正态曲线平坦或峰值的程度。 图解地示出了三种不同类型的曲线的形状。

kurtosis

正常曲线称为Mesokurtic曲线。 如果分布曲线比正常曲线或中间曲线曲线更尖锐,则其被称为勒曲曲线。 如果曲线的峰值比正常曲线小,则称为平片曲线。 峰度由力矩测量并由下式给出:

$ {\\ beta_2 = \\ frac {\\ mu_4} {\\ mu_2}} $

其中 -

  • $ {\\ mu_4 = \\ frac {\\ sum(x- \\ bar x)^ 4} {N}} $

\\ beta_2的值越大,曲线的峰值或曲率越大。 正常曲线的值为3,leptokurtic的\\ beta_2大于3,platykurtic的\\ beta_2小于3。

例子

问题陈述:

提供了一个工厂45名工人的日工资数据。 Compute \\ beta_1和\\ beta_2使用关于平均值的矩。 评论结果。

工资(卢比) 工人人数
100-200 1
120-200 2
140-200 6
160-200 20
180-200 11
200-200 3
220-200 2

解决方案:

工资
(Rs。)
工人数量
(f)
中午
m
m - $ {\\ frac {170} {20}} $
d
$ {fd} $ $ {fd ^ 2} $ $ {fd ^ 3} $ $ {fd ^ 4} $
100-200 1 110 -3 -3 9 -27 81
120-200 2 130 -2 -4 8 -16 32
140-200 6 150 -1 -6 6 -6 6
160-200 20 170 0 0 0 0 0
180-200 11 190 1 11 11 11 11
200-200 3 210 2 6 12 24 48
220-200 2 230 3 6 18 54 162
  ${N=45}$     $ {\\ sum fd = 10} $ $ {\\ sum fd ^ 2 = 64} $ $ {\\ sum fd ^ 3 = 40} $ $ {\\ sum fd ^ 4 = 330} $

由于偏差是从假定的平均值得到的,因此我们首先计算任意原点的时刻,然后计算平均值的时刻。 关于任意起源的时刻\'170\'

${\mu_1^1= \frac{\sum fd}{N} \times i = \frac{10}{45} \times 20 = 4.44 \\[7pt] \mu_2^1= \frac{\sum fd^2}{N} \times i^2 = \frac{64}{45} \times 20^2 =568.88 \\[7pt] \mu_3^1= \frac{\sum fd^2}{N} \times i^3 = \frac{40}{45} \times 20^3 =7111.11 \\[7pt] \mu_4^1= \frac{\sum fd^4}{N} \times i^4 = \frac{330}{45} \times 20^4 =1173333.33 }$

关于平均值的时刻

${\mu_2 = \mu'_2 - (\mu'_1 )^2 = 568.88-(4.44)^2 = 549.16 \\[7pt] \mu_3 = \mu'_3 - 3(\mu'_1)(\mu'_2) + 2(\mu'_1)^3 \\[7pt] \, = 7111.11 - (4.44) (568.88)+ 2(4.44)^3 \\[7pt] \, = 7111.11 - 7577.48+175.05 = - 291.32 \\[7pt] \\[7pt] \mu_4= \mu'_4 - 4(\mu'_1)(\mu'_3) + 6 (\mu_1 )^2 (\mu'_2) -3(\mu'_1)^4 \\[7pt] \, = 1173333.33 - 4 (4.44)(7111.11)+6(4.44)^2 (568.88) - 3(4.44)^4 \\[7pt] \, = 1173333.33 - 126293.31+67288.03-1165.87 \\[7pt] \, = 1113162.18 }$

从平均值的移动值,我们现在可以计算$ {\\ beta_1} $和$ {\\ beta_2} $:

${\beta_1 = \mu^2_3 = \frac{(-291.32)^2}{(549.16)^3} = 0.00051 \\[7pt] \beta_2 = \frac{\mu_4}{(\mu_2)^2} = \frac{1113162.18}{(546.16)^2} = 3.69 }$

从上面的计算可以得出结论,测量偏度的$ {\\ beta_1} $几乎为零,从而表明分布几乎是对称的。 $ {\\ beta_2} $测量峰度,具有大于3的值,因此意味着分布是leptokurtic。


统计 - 频率分布
统计 - 线性回归
温馨提示
下载编程狮App,免费阅读超1000+编程语言教程
取消
确定
目录

Statistics Tutorial

Statistics Useful Resources

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }