基于 SQL 计算信息熵与信息增益

last modify

Keywords: SQL, 信息熵 (Information Entropy),信息增益 (相对熵, KL 散度)

参考资料

测试数据

  • 第一列为用户 ID,第二列为性别,第三列为活跃度,最后一列用户是否流失。

  • 问题:性别和活跃度两个特征,哪个对用户流失影响更大?

计算

特征转置

特征统计/计数

Last updated