相关动态
【原创】R语言生存分析可视化数据分析报告论文(附代码数据)
2024-11-10 23:49

1、【原创】定制代写开发辅导答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassignment代写/代做Project/数据挖掘和统计分析可视化调研报告/程序/PPT等/爬虫数据采集服务(附代码数据),咨询QQ:3025393450欢迎登陆官网:/datablogR语言生存分析可视化数据分析报告R中的生存分析安装并加载所需的R包我们将使用两个R包:生存用于计算存活分析用于总结和可视化生存分析结果的survminer安装软件包install.packages(c(survival,survminer)加载包lib

【原创】R语言生存分析可视化数据分析报告论文(附代码数据)

2、rary(survival)library(survminer)示例数据集我们将使用生存包中提供的肺癌数据。data(lung)有问题百度搜索“石屛*据”就可以了欢迎登陆官网:/databloghead(lung)insttimestatusagesexph.ecogph.karnopat.karnomeal.calwt.loss3306234552310101521021883212102217411906810901090119060101007411501001175NA9012251590NA156011501190NA0805130机构:机构代码时间:以天为单位的生存时间状态:审查状

3、态1=审查,2=失效年龄:岁性别:男=1女=2ph.ecog:ECOG成绩得分(0=好5=死)ph.karno:医师对Karnofsky绩效评分(差=0-好=100)pat.karno:Karnofsky表现评分,按患者评分meal.cal:用餐时消耗的卡路里wt.loss:最近六个月的体重减轻计算生存曲线:survfit()我们要按性别计算生存率。函数survfit()在生存包中可用于计算kaplan-Meier生存估计。其主要论点包括:欢迎登陆官网:/datablog使用Surv()函数创建的生存对象以及包含变量的数据集。要计算生存曲线,请输入:fit-survfit(Surv(time,

4、status)sex,data=lung)print(fit)Call:survfit(formula=Surv(time,status)sex,data=lung)neventsmedian0.95LCL0.95UCLsex=1138112270212310sex=29053426348550默认情况下,函数print()显示生存曲线的简短摘要。它打印观察值,事件数,中位生存率和中位值的置信度限制。如果要显示生存曲线的更完整摘要,请键入以下内容:Summaryofsurvivalcurvessummary(fit)Accesstothesortsummarytablesummary(fit)

5、$table访问survfit()返回的值函数survfit()返回变量列表,包括以下组件:n:每条曲线中的对象总数。时间:曲线上的时间点。有问题百度搜索“柘花站居”就可以了欢迎登陆官网:/datablogn。风险:时间t处有风险的受试者人数n.event:在时间t发生的事件数。n。审查者:在时间t退出事件而不发生风险的审查者的数量。下,上:曲线的置信度上限和下限。分层:表示曲线估计的分层。如果地层不为NULL,则结果中有多条曲线。层次(因子)是曲线的标签。可以按以下方式访问组件:dns38(100)78(57)31(22)136(4)2(1)K(10066(73)26(29)11(12)2(

6、2)0(0)02004006003001000TimeindaysTimeindaysKaplan-Meier图可以解释如下:横轴(x轴)表示以天为单位的时间,纵轴(y轴)表示生存的可能性或生存的人口比例。线代表两组的存活曲线。曲线中的垂直下降表示事件。曲线上的垂直刻度线表示此时已对患者进行检查。在零时,生存概率为1.0(或100%的参与者还活着)。欢迎登陆官网:/datablog在时间250,性别=1的存活概率约为0.55(或55%),性别=2的存活概率约为0.75(或75%)。性别=2的中位生存期约为270天,性别=2的中位生存期约为426天,这表明性别=2的生存期高于性别=1可以使用以下

7、代码获得每组的中位生存时间:summary(fit)$tablerecordsn.maxn.startevents*rmean*se(rmean)median0.95LCL0.95UCLsex=1138138138112325.066322.59845270212310sex=290909053458.275733.78530426348550每组的中位生存时间代表生存概率S(t)为0.5的时间。性别=1(男性)的中位生存时间为270天,而性别=2(女性)则为426天。与男性相比,女性肺癌似乎具有生存优势。但是,要评估此差异是否具有统计学显着性,需要进行正式的统计检验,这将在下一节中讨论。注意

8、,置信极限在曲线的尾部很宽,很难进行有意义的解释。这可以通过以下事实来解释:在实践中,通常有一些患者在随访结束时迷失了随访或存活。因此,明智的做法是在随访结束之前在x轴上缩短绘图(Pocock等,2002)o可以使用参数xlim缩短生存曲线,如下所示:ggsurvplot(fit,=TRUE,risk.table.col=strata,#Changerisktablecolorbygroupsggtheme=theme_bw(),#Changeggplot2theme有问题百度搜索“匚石屛”就可以了欢迎登陆官网:/datablogpalette=c(#E7B800,#2E9FDF),xlim=

9、c(0,600)O.OD-020040DTime600+注意,可以使用参数fun指定三个经常使用的转换:“log”:幸存者功能的对数转换,事件”:绘制累积事件(f(y)=1-y)。也称为累积发生率“cumhaz:”绘制了累积危害函数(f(y)=-log(y)例如,要绘制累积事件,请键入:ggsurvplot(fit,=TRUE,risk.table.col=strata,#Changerisktablecolorbygroups【原创】定制代写开发辅导答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassig

10、nment代写/代做Project/数据挖掘和统计分析可视化调研报告/程序/PPT等/爬虫数据采集服务(附代码数据),咨询QQ:3025393450【原创】定制代写开发辅导答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassignment代写/代做Project/数据挖掘和统计分析可视化调研报告/程序/PPT等/爬虫数据采集服务(附代码数据),咨询QQ:3025393450有问题百度搜索“石踹丸訂居”就可以了欢迎登陆官网:/datablogggtheme=theme_bw(),#Changeggplot2t

11、hemepalette=c(#E7B800,#2E9FDF),fun=event)Stratasex=1+56x=2三署pra-nujnuKaplan-Meier生命表:生存曲线摘要如上所述,您可以使用函数summary()来获得生存曲线的完整摘要:summary(fit)有问题百度搜索“石屛*据”就可以了欢迎登陆官网:/datablog还可以使用功能surv_summary()在survminer程序包中获取生存曲线的摘要。与默认的summary()函数相比,surv_summary()创建一个包含来自survfit结果的摘要的数据框。res.sum-surv_summary(fit)hea

12、d(res.sum)timen.riskn.eventn.censorsurvstd.errupperlowerstratasex1113800.97826090.012689781.00000000.9542301sex=11213500.97101450.014707470.99941240.9434235sex=11313400.95652170.018148850.99115860.9230952sex=11513200.94927540.019677680.98660170.9133612sex=12613100.94202900.021117080.98183650.9038355

13、sex=13013000.93478260.022484690.97689890.8944820sex=1函数surv_summary()返回包含以下列的数据帧:时间:曲线有阶跃的时间点。n。风险:处于t风险中的受试者人数。n.event:在时间t发生的事件数。n。审查者:审查事件的数量。surv:估计生存概率。std.err:生存标准误差。upper:置信区间的上限较低:置信区间的下限分层:表示曲线估计的分层。层次(因子)是曲线的标签。【原创】定制代写开发辅导答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscience

14、assignment代写/代做Project/数据挖掘和统计分析可视化调研报告/程序/PPT等/爬虫数据采集服务(附代码数据),咨询QQ:3025393450有问题百度搜索“柘花站居”就可以了【原创】定制代写开发辅导答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassignment代写/代做Project/数据挖掘和统计分析可视化调研报告/程序/PPT等/爬虫数据采集服务(附代码数据),咨询QQ:3025393450有问题百度搜索“柘花站居”就可以了欢迎登陆官网:/datablog在生存曲线已拟合一个或多个

15、变量的情况下,surv_summary对象包含表示变量的额外列。这使得有可能按层次或某些因素组合来考虑ggsurvplot的输出。surv_summary对象还有一个名为“表”的属性,其中包含有关生存曲线的信息,包括具有置信区间的生存中位数以及每条曲线中受试者的总数和事件数。要访问“表”属性,请输入以下内容:attr(res.sum,table)比较生存曲线的Log-Rank检验:survdiff()对数秩检验是比较两个或多个生存曲线的最广泛使用的方法。零假设是两组之间的生存率没有差异。对数秩检验是一种非参数检验,它不对生存分布做出任何假设。本质上,对数秩检验将每个组中观察到的事件数与如果原假

16、设为真(即,生存曲线相同)时的预期事件数进行比较。对数秩统计量近似作为卡方检验统计量分布。函数survdiff()在生存包中可用于比较两个或更多生存曲线的对数秩检验。survdiff()可以如下使用:surv_diff-survdiff(Surv(time,status)sex,data=lung)surv_diffCall:survdiff(formula=Surv(time,status)sex,data=lung)NObservedExpected(O-E)A2/E(O-E)A2/Vsex=113811291.64.5510.3sex=2905373.45.6810.3Chisq=10.

17、3on1degreesoffreedom,p=0.00131欢迎登陆官网:/datablog该函数返回组件列表,包括:n:每组的科目数。obs:每组中事件的加权观测数量。exp:每个组中加权的预期事件数。chisq:用于检验相等性的卡方统计量。阶层:(可选)每个阶层中包含的主题数。生存差异的对数秩检验给出p值为p=0.0013,表明性别群体的生存差异显着。拟合复杂的生存曲线在本节中,我们将使用多个因素的组合来计算生存曲线。接下来,我们将结合多种因素来研究ggsurvplot()的输出1-使用结肠数据集拟合(复杂)生存曲线require(survival)fit2-survfit(Surv(ti

18、me,status)sex+rx+adhere,data=colon)1-使用survminer可视化输出。下图显示了根据rx&粘附力值按性别分面的生存曲线。#Plotsurvivalcurvesbysexandfacetbyrxandadhereggsurv-ggsurvplot(fit2,fun=event,=TRUE,ggtheme=theme_bw()ggsurv$plot+theme_bw()+theme(legend.position=right)+facet_grid(rxadhere)【原创】定制代写开发辅导答疑r/python/spss/matlab/WEKA/sas/sql

    以上就是本篇文章【【原创】R语言生存分析可视化数据分析报告论文(附代码数据)】的全部内容了,欢迎阅览 ! 文章地址:http://yejunbin01.xhstdz.com/quote/73361.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://yejunbin01.xhstdz.com/mobile/ , 查看更多   
发表评论
0评