统计 - 正态分布
正态分布是数据集的排列,其中大多数值集中在范围的中间,而其余值对称地朝向任一极值逐渐减小。 高度是遵循正态分布模式的一个简单例子:大多数人的平均身高
由于其扩张形状,正态分布的图形表示有时被称为钟形曲线。 精确的形状可以根据群体的分布而变化,但是峰值总是在中间并且曲线总是对称的。 在正态分布
式
$ {y = \\ frac {1} {\\ sqrt {2 \\ pi}} e ^ {\\ frac { - (x - \\ mu)^ 2} {2 \\ sigma}}} $
其中 -
$ {\\ mu} $ = Mean
$ {\\ sigma} $ =标准偏差
$ {\\ pi \\ approx 3.14159} $
$ {e \\ approx 2.71828} $
例子
问题陈述:
每日旅行时间的调查结果(以分钟计):
26 | 33 | 65 | 28 | 34 | 55 | 25 | 44 | 50 | 36 | 26 | 37 | 43 | 62 | 35 | 38 | 45 | 32 | 28 | 34 |
平均值为38.8分钟,标准偏差为11.4分钟。 将值转换为z-分数并准备正态分布图。
解决方案:
我们一直使用的z-score公式:
$ {z = \\ frac {x - \\ mu} {\\ sigma}} $
其中 -
$ {z} $ =“z-score"(标准分数)
$ {x} $ =要标准化的值
$ {\\ mu} $ =平均值
$ {\\ sigma} $ =标准差
转换26:
首先减去平均值:26-38.8 = -12.8,
然后除以标准偏差:-12.8 / 11.4 = -1.12
所以26是-1.12标准偏差
以下是前三个转换。
原始值 | 计算 | 标准分数(z分数) |
---|---|---|
26 | (26-38.8)/11.4= | -1.12 |
33 | (33-38.8)/11.4= | -0.51 |
65 | (65-38.8)/11.4= | -2.30 |
... | ... | ... |
在这里他们用图形表示: