扎心了,老铁,程序出了小差,请重新再试
重新再试

首页> 业务设计> 数据流程

益玩模型数据流转图

热门
益玩模型数据流转图
益玩模型数据流转图 {ROI
计划一 5%
计划三 10%
计划四 3%
,通过XGboost训练模型,生成多棵树
,
特征列过多的情况下,为了排除掉不相关/相关行较低的特征列
这里通过卡方校验计算每个特征和实际要预测的标签值之间的相关性。可以获得下列表格
特征列 相关性
特征A   0.8
特征B   0.7
特征C   0.6
....

然后只选取Top N 相关的指标进行模型训练
,训练模型,次日留存
计划一 30%
计划二 40%
计划三 20%
,对全部数据修复完成后如下所示
计划一 30% 5% 3W
计划二 40% 6%(这里先用平均数) 2W

,假设充值金额和计划好坏的相关行较低。
全部数据处理完成后如下所示
计划一 30% 5%
计划二 40% 6% 
,...,当日充值金额
计划一 3W
计划二 2W
,树N,评估模型

交叉验证评估模型
将数据分为N份后,取N-1份用训练,一份测试。
获取不同参数下训练出来的模型得分
根据得分获取到最优模型

,由于计划二的ROI 为 null ,无法用于模型训练。
这里主要通过两种方式进行数据修复
1、通过相似的计划数据预测计划二的ROI指标,
2、直接使用ROI的中位数/平均数填充
,ROI<0.7 
/\
是  否
    -0.5     +0.5   
,
数据预处理
,计划一 30% 5% 3W
计划二 40% null 2W
计划三 .....
,留存>20%
/\
是   否
   +1      -1   
}

文件简介

编号:4419

名称:益玩模型数据流转图

浏览数:119

收藏数:94

克隆数:16

作者:0

价格:5元

更新时间:2021-02-26 12:10:20

文件很好用,分享文件:

只需一步极速注册

163,195+文件在线编辑

云端同步我的设计

一键高清无水印下载

微信扫码立即登录
二维码失效
请点击刷新

微信和QQ是两个独立账号,账号信息不互通

距离今天活动结束仅剩
000000000毫秒
距离今天活动结束仅剩
000000000毫秒
距离今天活动结束仅剩
000000000毫秒
会员促销今天活动仅剩
000000000毫秒
距离今天活动结束仅剩
000000000毫秒