scikit-uplift

scikit-uplift (sklift) 是一个提升建模的 Python 包,提供了快速的 sklearn 风格模型实现、评估指标和可视化工具。

主要思想是提供一个易于使用且快速的Python包,用于提升建模。它通过熟悉的scikit-learn API提供模型接口。可以使用任何流行的估计器(例如,来自Catboost库的估计器)。

提升模型估计了处理的因果效应,并利用它来有效地针对最有可能对营销活动做出反应的客户。

提升模型的使用案例:

  • 营销活动中的目标客户。在推广一些热门产品时非常有用,因为有很大一部分客户在没有受到任何影响的情况下自行采取了目标行动。通过建模提升,您可以找到那些只有在受到处理(例如,收到推送)时才可能采取目标行动(例如,安装应用程序)的客户。

  • 结合流失模型和提升模型,向一组可能流失的客户提供一些奖励。

  • 在活动中选择一小部分客户,每位客户的价格较高。

了解更多关于提升建模问题的信息,请参阅用户指南

habr.com上的俄语文章:第1部分第2部分第3部分

为什么选择 sklift

  • 舒适且直观的scikit-learn风格API;

  • 在一个地方看到比以往更多的提升指标!包括像提升曲线下面积 (AUUC) 或 Qini曲线下面积 (Qini系数) 这样的精彩指标,以及理想情况;

  • 支持任何与scikit-learn兼容的估计器(例如Xgboost、LightGBM、Catboost等);

  • 所有方法都可以在sklearn.pipeline中使用。请参阅教程页面上的使用示例;

  • 此外,指标与sklearn.model_selection中的类兼容。请参阅教程页面上的使用示例;

  • 几乎所有实现的方法都解决了分类和回归问题;

  • 用于分析性能模型的漂亮且有用的可视化。

该包目前支持以下方法:

  1. 单独模型(也称为S-learner或处理虚拟变量,处理交互)方法

  2. 类转换(也称为类变量转换或还原标签)方法

  3. 两种模型(也称为X-learner,或朴素方法,或差异评分方法,或双分类器方法)方法,包括依赖数据表示

以及以下指标:

  1. 提升@k

  2. 提升曲线下的面积

  3. Qini曲线下的面积

  4. 加权平均提升

项目信息

社区

Sklift 正在积极维护中,并欢迎所有经验水平的新贡献者。

  • 请参阅我们的贡献指南以获取更多详细信息。

  • 通过参与此项目,您同意遵守其行为准则

感谢我们所有的贡献者!

Contributors

如果您有任何问题,请联系我们 team@uplift-modeling.com


论文和材料

  1. Gutierrez, P., & Gérardy, J. Y.

    因果推断与提升建模:文献综述。 在国际预测应用和API会议上(第1-13页)。

  2. Artem Betlei, Criteo Research; Eustache Diemert, Criteo Research; Massih-Reza Amini, Univ. Grenoble Alpes

    依赖和共享数据表示在不平衡治疗条件下提升预测效果 FAIM’18 CausalML研讨会。

  3. Eustache Diemert, Artem Betlei, Christophe Renaudin, and Massih-Reza Amini. 2018.

    大规模提升建模基准。 在AdKDD & TargetAd (ADKDD’18) 会议论文集。ACM,纽约,纽约州,美国,6页。

  4. Athey, Susan, and Imbens, Guido. 2015.

    用于估计异质因果效应的机器学习方法。 预印本,arXiv:1504.01132。Google Scholar。

  5. Oscar Mesalles Naranjo. 2012.

    测试提升模型的新指标。 为统计学与运筹学硕士学位提交的论文。

  6. Kane, K., V. S. Y. Lo, and J. Zheng. 2014.

    使用真实提升模型挖掘真正响应的客户和潜在客户: 新方法与现有方法的比较。 《营销分析杂志》2(4):218-238。

  7. Maciej Jaskowski and Szymon Jaroszewicz.

    临床试验数据的提升建模。 2012年ICML临床数据分析研讨会。

  8. Lo, Victor. 2002.

    真实提升模型 - 一种新颖的数据挖掘方法,用于数据库营销中的响应建模。 SIGKDD探索。4. 78-86.

  9. Zhao, Yan & Fang, Xiao & Simchi-Levi, David. 2017.

    使用多种处理和一般响应类型的提升建模。10.1137/1.9781611974973.66。

  10. Nicholas J Radcliffe. 2007.

    使用控制组针对预测提升:构建和评估提升模型。 直销分析杂志,(3):14–21, 2007。

  11. Devriendt, F., Guns, T., & Verbeke, W. 2020.

    学习排序以进行提升建模。ArXiv, abs/2002.05897。


标签

EN: 提升建模, 提升建模, 因果推断, 因果效应, 因果关系, 个体处理效应, 真实提升, 净提升, 增量建模

RU: 提升模型建模, Uplift 模型

ZH: uplift增量建模, 因果推断, 因果效应, 因果关系, 个体干预因果效应, 真实增量, 净增量, 增量建模