您所在位置: 网站首页 / 多元线性回归分析统计学.ppt / 文档详情
多元线性回归分析统计学.ppt 立即下载
2024-08-30
约2.3千字
约35页
0
79KB
举报 版权申诉
预览加载中,请您耐心等待几秒...

多元线性回归分析统计学.ppt

多元线性回归分析统计学.ppt

预览

免费试读已结束,剩余 30 页请下载文档后查看

15 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

多元线性回归多元线性回归内容安排多元线性回归模型与参数估计参数的最小二乘估计回归方程和偏回归系数的假设检验偏回归系数的假设检验
回归方程的假设检验若拒绝H0,则可分别对每一个偏回归系数bj作统计检验,实质是考察在固定其它变量后,该变量对应变量Y的影响有无显著性。
H0:Bj=0
H1:Bj不为零=0.05
F=(Xj的偏回归平方和/1)/MS误差
Xj的偏回归平方和:去Xj后回归平方和的减少量
若H0成立,可把Xj从回归方程中剔除,余下变量重新构建新的方程。
标准化偏回归系数和确定系数确定系数:

简记为R2,即回归平方和SS回归与总离均差平方和SS总的比例。
R2=SS回归/SS总
可用来定量评价在Y的总变异中,由P个X变量建立的线性回归方程所能解释的比例。

回归分析中的若干问题如职业,分四类可用三个伪变量:
y1y2y3
工人100
农民010
干部001
学生000多元线性回归方程的评价
评价回归方程的优劣、好坏可用确定系数R2和剩余标准差Sy,x1,2..p。
Sy,x1,2.p=SQRT(SS误差/n-p-1)

如用于预测,重要的是组外回代结果。
回归方程中自变量的选择选择变量的统计学标准选择变量的方法向前引入法(forwardselection)

自变量由少到多一个一个引入回归方程。将corr(y,xj)最大而又能拒绝H0者,最先引入方程,余此类推。至不能再拒绝H0为止。
向后剔除法(backwardselection)

自变量先全部选入方程,每次剔除一个使上述检验最不能拒绝H0者,直到不能剔除为止。
逐步引入-剔除法(stepwiseselection)

先规定两个阀值F引入和F剔除,当候选变量中最大F值>=F引入时,引入相应变量;已进入方程的变量最小F<=F剔除时,剔除相应变量。如此交替进行直到无引入和无剔除为止。(计算复杂)
多元线性回归方程的作用例:测量16名四岁男孩心脏纵径X1(CM)、心脏横径X2(CM)和心象面积Y(CM2)三项指标,得如下数据。试作象面积Y对心脏纵径X1、心脏横径X2多元线性回归分析。
例:某科研协作组调查山西某煤矿2期高血压病患者40例,资料如下表,试进行影响煤矿工人2期高血压病病人收缩压的多元线性回归分析。Logistic回归多元回归分析可用来分析多个自变量与一个因变量的关系,模型中因变量Y是边连续性随机变量,并要求呈正态分布。但在医学研究中,常碰到因变量的取值仅有两个,如药物实验中,动物出现死亡或生存,死亡概率与药物剂量有关。设P表示死亡概率,X表示药物剂量,P和X的关系显然不能用一般线性回归模型P=B0+B1X来表示。这时可用Logistic回归分析。内容安排Logistic回归模型以因变量D=1表示死亡,D=0表示生存,以P(D=1/X)表示暴露于药物剂量X的动物死亡的概率,设
P(D=1/X)=eBo+BX/(1+eBo+BX)
记Logit(P)=ln[p/(1-p)],则上式可表示为:
Logit(P)=Bo+BX
这里X的取值仍是任意的,Logit(P)的值亦在正负无穷大之间,概率P的数值则必然在0-1之间。p/(1-p)为事件的优势,Logit(P)为对数优势,故logistic回归又称对数优势线性回归
一般地,设某事件D发生(D=1)的概率P依赖于多个自变量(x1,x2,…,xp),且
P(D=1)=eBo+B1X1+…+BpXp/(1+eBo+B1X1+…+BpXp)
或
Logit(P)=Bo+B1X1+…+BpXp
则称该事件发生的概率与变量间关系符合多元Logistic回归或对数优势线性回归。
logistic回归模型参数的意义Logistic回归的参数估计Logistic回归的假设检验2、偏回归系数的显著性检验:目的是检验回归模型中自变量的系数是否为零,等价于总体优势比OR是否为零。
H0:B等于零H1:B不等于零
A、wald检验:
B、Scoretest:
C、likelihoodratiotest(waldchi-squaretest):回归模型中自变量的筛选Logistic回归的应用例1:在饮酒与食道癌的成组病例对照研究中,共有200例食道癌患者和774例非食道癌对照,年龄是混杂因素,按年龄分层后资料如下:
age对象(1=病例0=对照)饮酒不饮酒合计OR
25—341101
09106115
35---4414595.05
026164190
45----5412521465.67
029138167
55---6414234766.36
027138165
65---7411936552.58
01888106
75--15813
003131
例2:研究女生月经初潮与体质关系的调查中,某地调查了23名11—15岁女生的月经和体
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

多元线性回归分析统计学

文档大小:79KB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用