




如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
内容复习给定X的数值,Y的数值取在一个平均值(y|x)附近 对应于不同的X值,Y的平均值座落在一条直线上 ----回归直线. y|x和X的关系可用一个线性方程描写.回归系数及其计算线性回归分析的前提条件直线回归应用条件LINE示意图回归方程有统计学意义吗例1: 某研究者研究大气污染物一氧化氮(NO)的浓度(ppm)与汽车流量(千辆)、气温(℃)、空气湿度(%)、风速(m/s)等因素的关系,结果见表1:单位时间内过往的汽车数(千辆)、气温(℃)、空气湿度(%)、风速(m/s)这四个因素是否都对空气中一氧化氮(NO)的浓度(ppm)有影响? 如何定量地描述这些因素对一氧化氮浓度的影响? 哪个因素对一氧化氮浓度的影响最大?哪个因素的影响最小? 如果利用这些影响因素去预测空气中一氧化氮的浓度,如何预测?效果如何?第一节多重线性回归多重线性回归(multiplelinearregression) 因变量:一个,Y 自变量:多个,X1,X2,X3,…,Xp 多元线性回归(multi-variatelinearregression) 简称多元回归(multi-variateregression): 因变量:多个,Y1,Y2,… 自变量:多个,X1,X2,X3,…多重线性回归方程样本回归方程如果要建立由车流量()和风速()预测一氧化氮浓度(Y)的线性回归方程,模型可以写成:表13-1多重线性回归分析数据格式前提条件(LINE)多重线性回归分析步骤基本原理: 寻找一套适宜的偏回归系数(),建立多重线性回归方程,使得反应变量的观测值与回归方程的估计值SPSS实现方法:当建立样本回归方程后,首先要考察这个回归方程是否有意义?即在,,,,中,是否至少存在一个自变量与Y的总体均数呈线性关系? 回归方程的效果如何?也即是这四个自变量能够解释反应变量的变异的百分比是多少? 四个自变量是否都对反应变量有影响?即各个偏回归系数()所对应的总体偏回归系数()是否等于0?回归的目的:估计 H0成立时,只能用Y的均数来估计 残差:,自由度= H1成立时,给定可以用来估计 残差:,自由度= 残差减少了 方差分析的基本思想根据回归方程计算得到的预测值与实际观察值之间的差异称为残差,记残差的离均差平方和为,它反映了的变异中不能由回归解释的部分,其自由度记为 ,P为自变量个数。 把与之差记为回归平方和,它反应了回归模型的贡献,即车流量、气温、气湿和风速等因素对一氧化氮浓度的影响,其自由度记为。表13-2方差分析表表13-3检验回归方程整体意义的方差分析表 3132调整的确定系数(adjustedR2,)3435确定系数复相关系数(coefficientofmultiplecorrelation)回归系数的假设检验检验统计量为标准偏回归系数Standardizedpartialregressioncoefficient注意: 一般回归系数有单位,用来解释各自变量对应变量的影响,表示在其它自变量保持不变时,增加或减少一个单位时Y的平均变化量。不能用各来比较各对的影响大小。 标准化回归系数无单位,用来比较各自变量对应变量的影响大小,越大,对的影响越大。第二节回归分析中变量的选择残差平方和()缩小或确定系数()增大残差的均方()缩小或调整确定系数()增大AIC统计量自变量筛选的方法(一)最优子集回归法最优子集法的局限性(1)前进法(2)后退法(3)逐步回归法多重线性回归的应用(4)通过解释变量预测反应变量。例如,通过风速、汽车流量、气温等指标预测空气中一氧化氮的浓度。 (5)通过反应变量控制解释变量。例如,在气温、风速不变的情况下,通过控制汽车流量来实现空气中一氧化氮浓度不超过一定的水平。多重线性回归应用时的注意事项多重共线性是指在进行多元回归分析时,自变量间存在较强的线性相关关系。共线关系的存在,可使得估计系数方差加大,系数估计不稳,结果分析困难。因此在多因素线性回归分析时,特别是当回归结果难以用专业知识解释时,要进行共线性诊断,找出存在共线性且不重要的那些自变量,剔出方程,另行回归分析。 对于存在共线性的资料,可以利用共线性诊断有选择的保留自变量以消除共线性;或者采用岭回归、主成分回归等回归分析方法以避免共线性指标对结果的影响。剔除某个造成共线性的自变量,重建回归方程;合并自变量;采用逐步回归方法。 多重共线性的表现在实际应用中主要表现为: (1)模型拟合效果很好,但偏回归系数几乎都无统计学意义; (2)偏回归系数估计值的方差很大; (3)偏回归系数估计值不稳定,随着样本含量的增减各偏回归系数发生较大变化或当一个自变量被引入或剔除时其余变量偏回归系数有很大变化; (4)偏回归系数估计值的大小与符号可能与事先期望的不一致或与经验相悖,结果难以解释 出现以上表现,提示存在多重

天马****23
实名认证
内容提供者


最近下载