医学博士,R语言及Python爱好者,科研方向为真实世界研究,生信分析与人工智能研究。
今天看啥  ›  专栏  ›  灵活胖子的科研进步之路

批量对10种机器学习算法进行超参数调参及最佳结果对比第一部分(v0.1)

灵活胖子的科研进步之路  · 公众号  ·  · 2024-06-17 17:04
    

文章预览

整体思路 1.构建非模型依赖的超参数调参的指标,方便统一进行定义。 2.根据模型特点,基于mlr3语法,分别对每个模型进行超参数调参 3.采用mlr3的嵌套重采样架构,内层重采样为确定最佳超参数,外层重采样为评估模型性能,演示数据内层及外层均采用10成交叉验证。 4.目前mlr3一共支持40种二分类结果变量的机器学习模型,最终目标为统一定义函数批量对40种算法进行评估。 5.本次内容的超参数定义及其用法参考GPT4-BING。 6.理论上可以实现对不同特征(最优子集+过滤法筛选变量)组合,算法组合(单独算法或者组合算法)的批量运算筛选最佳特征集+模型的流程,不过考虑到图学习器的超参数的量过大,对于计算机的要求较高。 0.定义统一参数 library(future) library(mlr3verse) library(tidyverse) # 定义整体任务整体任务 task  < - tsk( "optdigits" ) # 查看任务中 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览