您的当前位置:首页一元线性回归模型与多元线性回归模型对比

一元线性回归模型与多元线性回归模型对比

2020-11-01 来源:爱问旅游网
真诚为您提供优质参考资料,若有不当之处,请指正。

一元线性回归模型 多元线性回归模型 总体回归函数 E(YX)01X YE(YX)01XE(YX1,X2Xk)01X12X2kXk 即E(YX)Xβ 即Y总体回归模型 (总体回归函数的随机表达形式) 样本回归模型 (样本回归函数的随机表达形式) 样本回归函数 YE(YX1,X2Xk)01X12X2kXkXβμ ˆe XβˆˆXe Y01ˆˆX ˆY01ˆˆXˆXˆXe 即YY01122kkˆˆXˆXˆX 即YˆˆY01122kk(X11,X12,X1k,Y1),ˆ Xβ给定一组容量为n的样本给定一组容量为n的样本(X21,X22,X2k,Y2),(Xi1,Xi2,Xik,Yi)(Xn1,Xn2,Xnk,Yn)则上述式子可以写成: , (X1,Y1),(X2,Y2),(Xi,Yi),(Xn,Yn)则,上述式子可以写成: 总体回归函数 E(YiXi)01Xi E(YiXi1,Xi2Xik)01Xi12Xi2kXik YiE(YiXi1,Xi2Xik)i01Xi12Xi2kXiki总体回归模型 YiE(YiXi)i01Xii 样本回归模型 样本回归函数 样本回归函数的离差形式 解释变量的个数(包括常数项) ˆˆXe Yi01iiˆˆX ˆYi01iˆx ˆiy1i2个: C,X 回归模型是正确设定的。 ˆˆXˆXˆXe Yi01i12i2kikiˆˆXˆXˆX ˆYi01i12i2kikˆ yˆxβ,X2,Xk k+1个: C,X1 模型设定正确假设。 基本假定 假设1: 1 / 5

真诚为您提供优质参考资料,若有不当之处,请指正。

假设2: 确定性假设。解释变量X是确定性变量,不是随机变量,在重复抽样中取固定值。: ① 样本变异性假设。对解释变量X抽取的样本观察值并不完全相同。 ② 样本方差趋于常数假设。 ,X2,Xk是非随机或固定的,且确定性假设。解释变量X1 各Xj之间不存在严格线性相关(无完全多重共线性)。 ①样本变异性假设。 各解释变量Xj在所抽取的样本中具有变异性。 ② 样本方差趋于常数假设。 随着样本容量的无限增加,各解释变量的样本方差区域一个非零的有限常数。 假设3: 假设4: 随机误差项μ零均值、同方差、不序列相关假随机误差项μ零均值、同方差、不序列相关假设。 设。 随机误差项与解释变量不相关。 正态性假设。随机项服从正态分布。 随机误差项与解释变量不相关。 假设5: 假设:6: 正态性假设。随机项服从正态分布。 参数估计 一元线性回归模型 残差平方和达到最小,得到正规方程组,求得参数的普通最小二乘估计值: 多元线性回归模型 残差平方和达到最小,得到正规方程组,求得参数的普通最普通最小二乘估计(OLS) 最小二乘估计的离差形式) 随机干扰项的方差的估计量 -1ˆ(XβX)XY 小二乘估计值xyiiˆ12-1xyxi(普通ˆ(βxx)ˆ ˆXY1ˆˆˆ00Y1X1kXk(普通最小二乘估计的离差形式) ˆ随机干扰项的方差2e2ink1eenk1 ˆ最大似然估计(ML) 矩估计(MM) 2e2in2 参数估计值估计结果与OLS方法一致,但随机干扰项的方差的估计量参数估计值估计结果与OLS方法一致,但随机干扰项的方差2 / 5

真诚为您提供优质参考资料,若有不当之处,请指正。

与OLS不2同ˆ2 参数估计量的性质 einˆ的估计量 2en2i 线性性、无偏性、有效性 2ˆ~N( )11 ,2xi线性性、无偏性、有效性 参数估计量的概率分布 ˆ~N( 00 ,Xinxi22 --- 2)样本容量n必须不少于模型中解释变量的个数(包括常数项),即nk1才能得到参数估计值,n-k8时t分布才比较稳定,能够进行变量的显著性检验,一般认为n30活样本容量问题 ---- 着至少n3k1时才能满足模型估计要求。如果样本量过小,则只依靠样本信息是无法完成估计的,需要用其他方法去估计。 统计检验 一元线性回归模型 多元线性回归模型 总离差平方和的分解 TSS=ESS+RSS R2总离差平方和的分解 TSS=ESS+RSS 拟合优度检验 ESSRSS1,(即总平方和中回归平方和的比例) TSSTSSR20,1对于同一个模型,R2越接近于1,拟合优度越高。 R21RSS(nk1)(调整的思路是残差平方和RSS和总平方和TSSTSS/(n1)R2ESSTSS,R20,1越接近于1,拟合优度越高。 各自除以它们的自由度) 为什么要对R进行调整?解释变量个数越多,它们对Y所能解释的部分越大(即回归平方和部分越大),残差平方和部分越小,R2越高,由增加解释变量引起的R2的增大与拟合好坏无关,因此在多元回归模型之间比较拟合优度, 是一个合适的指标,必须加以调整。 2R2就不方程总体显著性检验 ------ 目的:对模型中被解释变量与解释变量之间的线性关系在总体上是否成立做出判断。 原假设 3 / 5

真诚为您提供优质参考资料,若有不当之处,请指正。

备择假设:统计量的构造:判断步骤:①计算F统计量的值 ②给定显著性水平,查F分布的临界值表获得 ) ③ 比较F与的值, 若,拒绝原假设,认为原方程总体线性关系在的置信水平下显著。 若,接受原假设,不能认为原方程总体线性关系在的置信水平下显著。 目的:对模型中被解释变量对每一个解释变量之间的线性关系是否成立作出判断,或者说考察所选择的解释变量对被解释变量是否有显著的线性影响。针对某解释变量, 原假设:备择假设: 最常用的检验方法: t检验 构造统计量: 判断步骤:①计算t统计量的值 ②给定显著性水平,查t分布的临界值表获得 变量的显著性检验 ) ③比较t值与的值, 若,拒绝原假设,认为变量在的置信水平下通过显著性检验(或者说,在的显著性水平下通过检验),认为解释变量对被解释变量Y有显著线性影响。 若 参数的置信区间 目的:考察一次抽样中样本参数的估价值与总体参数的真实值的接近程度。 ,接受原假设,在显著性水平下没有足够证据表明对Y有显著线性影响。 4 / 5

真诚为您提供优质参考资料,若有不当之处,请指正。

思路:构造一个以样本参数的估计值为中心的区间,考察它以多大的概率包含总体参数的真实值。 方法:①预先选择一个概率,使得区间 ②计算其中的( 掌握概念:置信区间 置信度 显著性水平 实际应用中,我们希望置信度越高越好,置信区间越小越好(说明估计精度越高)。 如何缩小置信区间? (1)增大样本容量n(以减小,并减小参数估计值的样本方差) 越小) ) 包含参数真值),从而求出置信度下置信区间:(2)提高模型的拟合优度(以减小残差平方和,从而减小(3)提高样本观测值的分散度(样本值越分散,越小,

5 / 5

因篇幅问题不能全部显示,请点此查看更多更全内容