codecamp

统计 - 线性回归

一旦使用共同关系分析建立了变量之间的关系程度,自然地深入了解关系的性质。 回归分析有助于确定变量之间的因果关系。 如果可以使用图形方法或代数方法预测自变量的值,则可以预测其他变量(称为因变量)的值。

图形方法

它涉及绘制一个具有X轴上的自变量和Y轴上的因变量的散点图。 之后,以这样的方式绘制线,使得其穿过大部分分布,其中剩余点几乎均匀地分布在线的任一侧。

回归线被称为总结数据的一般运动的最佳拟合线。 它显示对应于另一个的平均值的一个变量的最佳平均值。 回归线基于这样的标准,即它是使因变量的预测值和观测值之间的偏差的平方和最小化的直线。

代数法

代数方法开发两个回归方程,X在Y上,Y在X上。

Y对X的回归方程

$ {Y = a + bX} $

其中 -

  • $ {Y} $ =从属变量

  • $ {X} $ =独立变量

  • $ {a} $ =显示Y截距的常量

  • $ {b} $ =显示线的斜率的常数

a和b的值通过以下正规方程获得:

$ {\\ sum Y = Na + b \\ sum X \\\\ [7pt]
\\ sum XY = a \\ sum X + b \\ sum X ^ 2
} $

其中 -

  • $ {N} $ =观察次数

X在Y上的回归方程

$ {X = a + bY} $

其中 -

  • $ {X} $ =从属变量

  • $ {Y} $ =独立变量

  • $ {a} $ =显示Y截距的常量

  • $ {b} $ =显示线的斜率的常数

a和b的值通过以下正规方程获得:

$ {\\ sum X = Na + b \\ sum Y \\\\ [7pt]
\\ sum XY = a \\ sum Y + b \\ sum Y ^ 2
} $

其中 -

  • $ {N} $ =观察次数

例子

问题陈述:

研究者发现父亲和儿子的体重趋势之间存在着一种共同关系。 他现在对从给定数据的两个变量开发回归方程感兴趣:

父亲重量(公斤) 69 63 66 64 67 64 70 66 68 67 65 71
儿子重量(Kg) 70 65 68 65 69 66 68 65 71 67 64 72

发展

  1. Y对X的回归方程。

  2. on的回归方程。

解决方案:

$ {X} $ $ {X ^ 2} $ $ {Y} $ $ {Y ^ 2} $ $ {XY} $
69 4761 70 4900 4830
63 3969 65 4225 4095
66 4356 68 4624 4488
64 4096 65 4225 4160
67 4489 69 4761 4623
64 4096 66 4356 4224
70 4900 68 4624 4760
66 4356 65 4225 4290
68 4624 71 5041 4828
67 4489 67 4489 4489
65 4225 64 4096 4160
71 5041 72 5184 5112
$ {\\ sum X = 800} $ $ {\\ sum X ^ 2 = 53,402} $ $ {\\ sum Y = 810} $ $ {\\ sum Y ^ 2 = 54,750} $ $ {\\ sum XY = 54,059} $

Y对X的回归方程

Y = a + bX

其中,a和b通过正规方程获得

${\sum Y = Na + b\sum X \\[7pt] \sum XY = a \sum X + b \sum X^2 \\[7pt] Where\ \sum Y = 810, \sum X = 800, \sum X^2 = 53,402 \\[7pt] , \sum XY = 54, 049, N = 12 }$

$ {\\ Rightarrow} $ 810 = 12a + 800b ...(i)

$ {\\ Rightarrow} $ 54049 = 800a + 53402 b ...(ii)

将方程(i)乘以800,方程(ii)乘以12,得到:

96000 a + 640000 b = 648000 ...(iii)

96000 a + 640824 b = 648588 ...(iv)

从(iii)中减去方程(iv)

-824b = -588

$ {\\ Rightarrow} $ b = -.0713

将b的值代入eq。 (一世)

810 = 12a + 800(-0.713)

810 = 12a + 570.4

12a = 239.6

$ {\\ Rightarrow} $ a = 19.96

因此,X上的方程Y可写为

${Y = 19.96 - 0.713X}$

Y对X的回归方程

X = a + bY

其中,a和b通过正规方程获得

${\sum X = Na + b\sum Y \\[7pt] \sum XY = a \sum Y + b \sum Y^2 \\[7pt] Where\ \sum Y = 810, \sum Y^2 = 54,750 \\[7pt] , \sum XY = 54, 049, N = 12 }$

$ {\\ Rightarrow} $ 800 = 12a + 810a + 810b ...(V)

$ {\\ Rightarrow} $ 54,049 = 810a + 54,750 ...(vi)

将eq(v)乘以810,将eq(vi)乘以12,得到

9720 a + 656100 b = 648000 ...(vii)

9720 a + 65700 b = 648588 ...(viii)

从等式vii减去等式viii

900b = -588

$ {\\ Rightarrow} $ b = 0.653

将等式(v)中的b的值代入等式

800 = 12a + 810(0.653)

12a = 271.07

$ {\\ Rightarrow} $ a = 22.58

因此,X和Y的回归方程是

${X = 22.58 + 0.653Y}$

统计数据 - 峰度
统计 - 排列
温馨提示
下载编程狮App,免费阅读超1000+编程语言教程
取消
确定
目录

Statistics Tutorial

Statistics Useful Resources

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }