码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 金融风控建模常用指标介绍(WOE, IV, KS, PSI)


    金融风控建模常用指标介绍(WOE, IV, KS, PSI)

    近期在做金融风控相关项目,有必要把特征和模型的衡量指标总结下,以备不时之需。这次主要介绍4个指标(WOE, IV, KS, PSI)。

    • WOE(Weight of Evidence, 用于特征变换,衡量变量某个取值的预测能力)
      WOE算法已在我的另一篇文章数据预处理-分箱(Binning)和 WOE编码介绍过,这里不再赘述。

    • IV(Information Value, 衡量特征的预测能力)
      在这里插入图片描述其中,
      在这里插入图片描述
      IV值可以看作WOE值的加权求和,IV值的衡量标准可以参考:
      在这里插入图片描述

    • KS(Kolmogorov-Smirnov, 衡量模型对好坏样本的区分能力)

    每个分箱中累计坏客户率减去累计好客户率的最大值。
    在这里插入图片描述
    举例:样本总量891,好客户549,坏客户342(见下标),表中数据计算方法。

    • 表中第一行:

      total_rate=90/891=10.1%,

      cum_good_rate=good_rate=2/549=0.36%,

      cum_bad_rate=bad_rate=88/342=25.73%,

      ks=25.73% - 0.36% = 25.4%。

    • 表中第二行,

      total_rate=89/891=10.0%,

      good_rate=24/549=4.37%,

      bad_rate=65/342=19.01%,

      cum_good_rate=0.36%+4.37%=4.74%,

      cum_bad_rate=25.73%+19.01%=44.74%,

      ks=44.74%-4.74%=40%
      在这里插入图片描述
      从表中可以发现,当分类阈值设为0.65时,对好坏样本的区分度最高。

    • PSI(Population Stability Index,衡量模型和特征的稳定性)
      在这里插入图片描述
      其中,Ai代表第i组的实际占比(上线后数据),Ei代表第i组的期望占比(训练数据)。
      在这里插入图片描述
      PSI值为0.018,模型稳定。PSI值的衡量标准参考:
      在这里插入图片描述
      注:PSI和IV在取值范围与业务含义的对应上也是存在统一性,只是应用场景不同——PSI用以判断变量稳定性,IV用以判断变量预测能力。

  • 相关阅读:
    Java----集合框架(Collection)、foreach的用法
    麒麟系统+lnmp+laravel 搭建
    JavaEE之CSS②(前端)
    Cuckoo沙箱各Ubuntu版本安装及使用
    社群运营的9个有效玩法 沈阳新媒体运营培训
    第一章《初学者问题大集合》第3节:学了Java编程能应聘什么岗位
    jvm中的类加载器
    LeetCode题解:2. 两数相加,递归,JavaScript,详细注释
    【Python机器学习】零基础掌握gaussian_process高斯过程中的核函数
    数据挖掘-KNN算法+sklearn代码实现(六)
  • 原文地址:https://blog.csdn.net/weixin_41891249/article/details/132941255
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号