主要观点总结
文章介绍了第32期文献分享会的内容,包括基于机器学习识别糖尿病患者杂志情况的研究目的、方法、结果和结论。文章提出了一个名为DRING的机器学习模型,用于从NFG个体中识别遗漏的糖尿病患者,同时进行了特征重要性分析。文章还讨论了模型的可解释性和性能,以及与其他模型的比较。此外,文章还提到了课程设计和内容,包括Python环境构建、机器学习、模型可解释性、影像组学等方面的内容。
关键观点总结
关键观点1: 研究目的
提出一个机器学习模型DRING,用于识别糖尿病患者杂志情况,从NFG个体中识别遗漏的糖尿病患者。
关键观点2: 数据集和方法
使用来自三个中国队列的超过60,000名个体的体检数据,通过预处理后保留样本数量分别为61059、369和3247个样本。采用逻辑回归、随机森林、支持向量机和深度神经网络等算法进行模型构建。
关键观点3: 模型性能
逻辑回归模型在验证集上表现最佳,AUC值达到0.899。通过五倍交叉验证和独立测试集验证,模型性能稳健。结合人口统计学特征与血常规指标,逻辑回归模型能有效区分糖尿病患者与健康人群。
关键观点4: 课程设计
课程包括Python环境构建、基础语法、常见库应用、机器学习、模型可解释性、影像组学等内容。授课形式为远程在线实时直播授课,总课时不少于30小时。
关键观点5: 奖励政策
学员应用所学内容发表IF 10+文章可退还学费。
文章预览
第32期文献分享会-BMC Medicine最新文章-基于机器学习识别糖尿病患者 杂志情况 文章情况 研究目的 提出一个机器学习模型DRING(空腹血糖正常个体的糖尿病风险),用于从NFG个体中识别遗漏的糖尿病患者,同时通过特征重要性分析揭示糖尿病的危险因素。 Methods 数据集:研究使用了来自三个中国队列的超过60,000名具有正常空腹血糖(NFG)的个体的体检数据。通过预处理之后,三个数据集D1 D2 D3分别保留61059、369、3247个样本,分别包含603、3、21名糖尿病患者 排除标准和分组:WHO诊断标准:糖尿病患者通过糖化血红蛋白(HbA1c)水平定义,即HbA1c ≥ 48 mmol/mol(或6.5%)。排除缺失值和异常值的样本。根据阈值6.5%的HbA1c水平分为糖尿病组和正常组 数据集特征:所有数据集包含27个体格检查特征,包括性别、年龄、身高、体重指数(BMI)、空腹血糖(FBG)、白细胞计数
………………………………