文章预览
今天小塔在浏览数据挖掘文献,发现了一篇发在Am J Kidney Dis(IF=13.2)的优秀文献,整体思路通透,简单易复现。 在进行公共临床数据库的数据挖掘时,有一些注意事项: 1、要重视数据的质量和数量。数据质量可能对结果产生显著影响,因此需要清洗和预处理数据,包括处理缺失值、异常值和不一致的值。 2、需要选择与研究对象和变量数据分布特征相匹配的数据挖掘方法,这可能需要尝试多种方法并进行比对与适当改进。在分析的过程中,需要注意数据的类型和特征,例如是否是分类变量、连续变量还是有序分类变量。 3,数据标准化和参数设定,在数据挖掘前,可能需要对数据格式进行转换和标准化。需要设定合适的参数,进行模型训练。 4、重视数据的隐私和安全:公共临床数据库的信息需要得到保护,特别是在数据传输和存储时。要采取措
………………………………