针对个人信用数据存在连续型和离散型交织并存以及类不平衡问题,为提高信用评估分类效果,提出一种结合代价敏感和集成算法的个人信用评估分类模型。通过集成信息价值、互信息、信息增益率和基尼指数特征,选择算法生成最优特征子集。结合代价敏感构建以L1-逻辑回归、弹性网-逻辑回归、贝叶斯、决策树和神经网络为基模型的集成模型,并辅之动态加权投票策略。实证结果表明,将集成特征选择算法的模型指标G-means和F-value与原始特征集相比,分别提升了8%和18%,与mRMR特征选择后模型的预测性能相比也有一定提升,且该模型具有一定的鲁棒性。
0 引言
随着贷款消费的不断发展,个人信用评估已成为银行等金融机构密切关注的热点。截至2019年9月底,国民贷款消费达到13.34万亿元,同比增长17.4%