最近在做患病與否和PRS、年齡、性別等回歸方程,這里把我的做法做一個(gè)總結(jié),以下以SPSS為例 R中也一樣glm一下 1、數(shù)據(jù)你們都有的整理好扔到SPSS里,順便整理下個(gè)數(shù)據(jù)格式,連續(xù)型變量要設(shè)為標(biāo)度 2、回歸 我用的是患病與否做因變量,所以我選擇二元邏輯回歸(分析→回歸→二元logistics)
因變量:患病與否 自變量:你想分析的,連續(xù)型變量不用處理,二分類(lèi)變量需要在分類(lèi)里選擇分類(lèi)變量 保存選擇概率就好了,繪制ROC需要 選項(xiàng)里能選的都選上,反正能多出點(diǎn)看看數(shù)據(jù)情況
確定會(huì)出相應(yīng)的回歸曲線 結(jié)果主要看這兩張表 第一張表主要是以曲線判定預(yù)測(cè)正確率 第二張表B為方程系數(shù)、顯著性(sig.)為顯著性差異、Exp為or值最后兩列為上下限 方程公式為P=1/(1+EXP(x)),上圖為例年齡、性別、PRS均顯著,所以x=0.118age+0.439sex+0.876*PRS-11.938
3.ROC曲線繪制及cutoff值確定 分析→ROC曲線 驗(yàn)證變量:上一步保留的概率 狀態(tài)變量:患病與否等因變量 同樣的能勾選的都勾選了
查看結(jié)果 個(gè)案情況
區(qū)域大于0.7就是比較好了,當(dāng)然太大就要懷疑一下了,比如0.9以上,過(guò)于優(yōu)秀了,p值一樣的要小于0.05。 數(shù)據(jù)量小時(shí)線不是那么平滑,可以雙擊曲線,add interdependent line→spline→apply,然后選中原線條按delete 這里就是cutoff值了,第一列和第二列差值最大值對(duì)應(yīng)的變量為cutoff值
cutoff的具體判定方法如下圖
|