700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 张红英模型matlab 基于GA_Xgboost模型的糖尿病风险预测

张红英模型matlab 基于GA_Xgboost模型的糖尿病风险预测

时间:2021-08-24 12:28:28

相关推荐

张红英模型matlab 基于GA_Xgboost模型的糖尿病风险预测

0 概述

糖尿病是一种严重危害人类身体健康的慢性病,是由于胰岛素分泌不足或外围组织对胰岛素不敏感而引起的代谢性疾病,其以持续的高血糖状态为特征,容易致使各种组织器官长期受损。

根据国际糖尿病联盟(IDF)统计,全球糖尿病患者约有4.25亿人,每11名成年人中就有1人患有糖尿病,每2名患者中就有1名未确诊[1]。预计到2045年,全球将有近7亿人患糖尿病。据统计,我国成年糖尿病患病人数达到1.14亿,相应医疗支出高达1 100亿美元,超过130万人死于糖尿病及其并发症,其中41%以上的人年龄低于60岁,逐渐呈年轻化趋势[1-2]。

糖尿病无法根治,且容易引发多种并发症,为社会和家庭带来沉重的经济负担。全球每年用于糖尿病人群的医疗支出费用为8 270亿美元,占所有医疗支出的12%。目前糖尿病已经严重影响到居民健康水平和经济的快速发展,糖尿病预测问题亟待解决。因此,本文针对糖尿病的临床指标,结合Xgboost的预测优势和遗传算法的搜索能力,建立GA_Xgboost预测模型,对血糖值进行预测,确定高危人群并提前预警,辅助医生进行早期干预,从而降低糖尿病发病率。

1 相关研究

目前,大量学者对糖尿病预测进行了深入研究,构建了许多预测模型。这些预测模型根据不同应用场景而建立,对于推动糖尿病的快速诊断进而提高医生诊断效率具有重要作用。

1.1 回归模型

回归模型是一种研究因变量和自变量关系的预测性建模技术,该模型综合考虑各种可能危险因素,通常以多元回归模型或Cox比例风险模型预测未来一定时间内糖尿病的发病概率。

多元回归模型是应用较广泛的一种方法,既可以用于个体糖尿病发病风险的预测,如文献[3]建立的糖尿病视网膜病变预测模型,也可以用于群体糖尿病危险因素的研究,如文献[4]对我国农村居民糖尿病患病因素的分析。多元回归模型解释性强但精度欠佳,不适用于大量指标的预测。

Cox回归模型以生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响,常用于医学随访研究。文献[5]用Cox回归模型建立了适合中国人群的糖尿病风险预测模型,文献[6]则用Cox回归模型研究胰岛素依赖型糖尿病患者的死亡率。然而Cox回归模型要求对数据连续观测且追踪时间不宜过短,成本较高。

1.2 决策树模型

决策树作为从大规模数据中探索概念构成的代表,是弱化模型结构仅从数据出发构建概念的典型。基于决策树建立的预测模型,能对预测结果提供相应的分析依据。文献[7-8]采用决策树建立了糖尿病临床治疗决策系统,提高了糖尿病的诊治效率。文献[9-10]探索决策树模型在糖尿病预测中的应用,发掘糖尿病患病的得病风险规律。

实际上,决策树作为一种模仿人类思考的建模思路,一般并不单独用于模型的建立,而是以其为基函数,根据集成思想建立预测模型。

1.3 支持向量机模型

支持向量机是一种建立在VC维的统计学理论和结构风险最小化原理基础上的机器学习算法,通过核函数将输入向量映射到高维空间,从而得到最优分类超平面。文献[11]建立了基于支持向量机的预测模型,探讨环境因素和遗传因素对2型糖尿病患病的影响。文献[12-13]基于支持向量机分别建立了糖尿病前期筛查模型和标准化糖尿病诊断模型。

支持向量机具有解决小样本学习、非线性、高维和泛化等问题的独特优势,但对于高维数据,它更多考虑通过核函数来解决,很少从物理降维出发,耗费大量的机器内存和运算时间。

1.4 神经网络模型

神经网络是一种基于大脑和神经系统研究而建立的计算模型。在这种模型中,大量节点之间相互联结构成网络,以达到处理信息的目的。文献[14]以

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。