泊松回归[SPSS一般对数线性分析过程]

发布网友 发布时间:2024-12-16 23:36

我来回答

1个回答

热心网友 时间:2025-01-15 12:08

转自个人微信公众号【Memo_Cleon】的统计学习笔记: 泊松回归[一般对数线性分析过程]。

【1】计数资料[count data]

“哮喘患者一个月内急性发作次数”是计数资料。[是否发作]和[发作次数]的数据类型不一样,[是否发作]属于分类资料(categorical data),而[发作次数]是计数资料[count data]。

分类资料常用单因素分析方法为卡方分析,多因素分析考虑logistic回归、对数线性回归。计数资料最常用的是Poisson回归,即泊松回归。泊松回归常用来研究单位时间/单位面积/单位空间内某事件的发生数的影响因素。

【2】Poisson分布

泊松回归要求满足泊松分布,泊松分布的概率密度函数表示单位时间/单位面积/单位空间内某事件发生k次的概率,λ是泊松分布唯一的参数,即均值和方差,λ越大Poisson分布越逼近正态分布。

【3】Poisson回归

泊松回归模型通过λ(均值)预测事件发生次数。偏回归系数β的意义:β0表示各个“自变量取值为0”时的自然对数值,其他自变量取值不变时,自变量每增加一个单位,λ的自然对数值增加,β为正表示增加,β为负表示减少。

当不同观察单位的发生事件观测基数不一样时,需要将发生数除以相应单位的总观测数,用于抵消观察单位数的不同对结果造成的的影响。

β0表示参照水平的事件发生率的自然对数,exp(β0)表示参照水平的事件发生率。βi则表示自变量每改变一个单位,事件发生率自然对数值的改变量,转换成IRR,即exp(βi),表示自变量每改变一个单位,事件发生率是参照水平的exp(βi)倍。

SPSS操作界面不友好,需要专门的数据格式匹配模型。

【4】示例1:英国男性医生冠心病死亡与吸烟、年龄的关系。

数据录入:smoke(0=不吸烟,1=吸烟),agecat(0=35-44岁,1=45-54岁,2=5-岁,3=65-74岁,5=75-84岁),deaths表示存活人数变量,pyears表示人年数,相当于总观察数。

泊松回归:Analyze>>Loglinear>>General…

结果:

校正年龄因素后,与抽烟的男医生相比,不抽烟的男医生的冠心病死亡风险更低,不抽烟是抽烟死亡风险的0.70倍,或1.43倍。

校正吸烟因素后,随着年龄的增加,死亡风险也在增加。75-84岁的男医生的冠心病死亡风险分别是35-44岁、45-54岁、55-岁、65-74岁的男医生的40.45倍、9.17倍、2.92倍和1.42倍。

交互作用具有统计学意义,吸烟对冠心病死亡的影响随着年龄的增大而增大。

通过参数估计表可以对简单效应做判断,但无法判断是否有统计学意义。可通过分割文件分组比较来明确统计学意义。

转自个人微信公众号【Memo_Cleon】的统计学习笔记: 泊松回归[一般对数线性分析过程]。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com