发布网友 发布时间:2024-12-16 23:36
共1个回答
热心网友 时间:2025-01-15 12:08
转自个人微信公众号【Memo_Cleon】的统计学习笔记: 泊松回归[一般对数线性分析过程]。
【1】计数资料[count data]
“哮喘患者一个月内急性发作次数”是计数资料。[是否发作]和[发作次数]的数据类型不一样,[是否发作]属于分类资料(categorical data),而[发作次数]是计数资料[count data]。
分类资料常用单因素分析方法为卡方分析,多因素分析考虑logistic回归、对数线性回归。计数资料最常用的是Poisson回归,即泊松回归。泊松回归常用来研究单位时间/单位面积/单位空间内某事件的发生数的影响因素。
【2】Poisson分布
泊松回归要求满足泊松分布,泊松分布的概率密度函数表示单位时间/单位面积/单位空间内某事件发生k次的概率,λ是泊松分布唯一的参数,即均值和方差,λ越大Poisson分布越逼近正态分布。
【3】Poisson回归
泊松回归模型通过λ(均值)预测事件发生次数。偏回归系数β的意义:β0表示各个“自变量取值为0”时的自然对数值,其他自变量取值不变时,自变量每增加一个单位,λ的自然对数值增加,β为正表示增加,β为负表示减少。
当不同观察单位的发生事件观测基数不一样时,需要将发生数除以相应单位的总观测数,用于抵消观察单位数的不同对结果造成的的影响。
β0表示参照水平的事件发生率的自然对数,exp(β0)表示参照水平的事件发生率。βi则表示自变量每改变一个单位,事件发生率自然对数值的改变量,转换成IRR,即exp(βi),表示自变量每改变一个单位,事件发生率是参照水平的exp(βi)倍。
SPSS操作界面不友好,需要专门的数据格式匹配模型。
【4】示例1:英国男性医生冠心病死亡与吸烟、年龄的关系。
数据录入:smoke(0=不吸烟,1=吸烟),agecat(0=35-44岁,1=45-54岁,2=5-岁,3=65-74岁,5=75-84岁),deaths表示存活人数变量,pyears表示人年数,相当于总观察数。
泊松回归:Analyze>>Loglinear>>General…
结果:
校正年龄因素后,与抽烟的男医生相比,不抽烟的男医生的冠心病死亡风险更低,不抽烟是抽烟死亡风险的0.70倍,或1.43倍。
校正吸烟因素后,随着年龄的增加,死亡风险也在增加。75-84岁的男医生的冠心病死亡风险分别是35-44岁、45-54岁、55-岁、65-74岁的男医生的40.45倍、9.17倍、2.92倍和1.42倍。
交互作用具有统计学意义,吸烟对冠心病死亡的影响随着年龄的增大而增大。
通过参数估计表可以对简单效应做判断,但无法判断是否有统计学意义。可通过分割文件分组比较来明确统计学意义。
转自个人微信公众号【Memo_Cleon】的统计学习笔记: 泊松回归[一般对数线性分析过程]。