今天看啥  ›  专栏  ›  金科应用研院

解析:特征筛选在策略中的应用

金科应用研院  · 公众号  ·  · 2024-09-04 08:31

文章预览

01 Q: 现在的数据监管背景下,如下图所示的一些通话记录和APP下载记录类的特征衍生会受限吗(因为拿不到用户的这些原始特征)? ‍ (以上课件 来自: 【第3期】量化风险 建模师-认证班 ) A: 会有影响,一般业务测本身拿不到客户的通讯记录信息。但自身app的埋点信息和一些基础的设备信息是可以获取的。通话记录可以尝试购买三方数据,后面可能会直接对接征信机构去测试采购,他们一般具有完整的授权链。 02 Q: 通过描述性统计,进行特征探索性分析并剔除变量的初筛方式,比如剔除top1占比过高的字符型变量,这个逻辑是只对LR型模型适用,还是即使是XGB这样的机器学习模型,这个变量预选择逻辑也适用? ‍ A: 对所有模型均可以适用,因为变量top1占比过高(95%+)其本身变异程度很小,所带的信息也不足于区分好坏(其iv应该非常低 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览