测量交互#

interpret.utils.measure_interactions(X, y, interactions=None, init_score=None, sample_weight=None, feature_names=None, feature_types=None, max_interaction_bins=32, min_samples_leaf=2, min_hessian=0.001, reg_alpha=0.0, reg_lambda=0.0, max_delta_step=0.0, objective=None)#

运行FAST算法并返回排名后的交互及其强度作为字典。

Parameters:
  • X – 训练样本的数组

  • y – 训练目标的数组

  • interactions – 要评估的交互 可以是一个特征索引的元组列表,或者是一个整数,表示返回的最大对数。 None 表示评估所有成对交互

  • init_score – 可以生成分数的模型或每个样本的初始化分数。 如果是样本分数,它应该与X和y的长度相同。

  • sample_weight – 每个样本的可选权重数组。应与X和y的长度相同

  • feature_names – 特征名称列表

  • feature_types – 特征类型的列表,例如“连续”或“名义”

  • max_interaction_bins – 每个交互项的最大分箱数

  • min_samples_leaf – 计算增益时用于树分裂的最小样本数

  • min_hessian – 考虑潜在分割有效所需的最小hessian值

  • reg_alpha – L1 正则化。

  • reg_lambda – L2 正则化。

  • max_delta_step – 用于限制树叶子节点的最大输出。<=0.0 表示无约束。

  • 目标 – 无 (rmse 或 log_loss), “rmse” (回归默认), “log_loss” (分类默认), “泊松偏差”, “特威迪偏差:方差幂=1.5”, “伽马偏差”, “伪胡伯:delta=1.0”, “rmse_log” (带有对数链接函数的rmse)

Returns:

包含特征索引元组和交互强度的列表,

例如 [((1, 2), 0.134), ((3, 7), 0.0842)]。按交互强度递减排序。