codecamp

统计数据 - 数据模式

当它们以图形方式绘制时,数据模式是非常有用的。 数据模式通常根据特征,如中心,展布,形状和其他不寻常的属性来描述。 其他特殊描述性标签是对称的,钟形的,歪斜的等。

中央

图形地,分布的中心位于分布的中值。 这样的图表显示,几乎一半的观察在任一侧。 每列的高度表示观察的频率。

Center Data Pattern

传播

分布的扩展是指数据的变化。 如果观测集合覆盖范围较宽,则扩展较大。 如果观察值集中在单个值周围,则扩展更小。

Spread Data Pattern

形状

可以使用以下特性描述分布的形状。

  • 对称 - 在对称分布中,图形可以在中心处分开,使得每一半都是另一半的镜像。

    Symmetry
  • 峰数。 - 具有一个或多个峰的分布。 具有一个清晰峰的分布被称为单峰,具有两个清楚峰的分布被称为双峰。 在中心处的单个峰对称分布被称为钟形。

    Number of peaks
  • 偏斜 - 某些分布在图形的一侧可能有多个观察结果。 对较低值的观察值较少的分布被称为偏斜; 而对较低值的观察值较少的分布被称为左偏。

    Skewness
  • 统一 - 当观察集合没有峰值并且数据在分布范围内均匀分布时,则该分布称为均匀分布。

    Uniform

不寻常的特点

数据模式的常见异常特征是缺口和异常值。

  • 间隙 - 间隙指向没有观察结果的分布区域。 下图有一个缺口,因为在分布的中间没有观察。

    Gaps
  • 异常值 - 分布可以用与其他观测数据集大不相同的极值表征。 这些极端值被称为异常值。 下图说明了具有异常值的分布。

    Outliers

统计数据 - 连续均匀分布
统计 - - 直方图
温馨提示
下载编程狮App,免费阅读超1000+编程语言教程
取消
确定
目录

Statistics Tutorial

Statistics Useful Resources

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }