测量交互#
- interpret.utils.measure_interactions(X, y, interactions=None, init_score=None, sample_weight=None, feature_names=None, feature_types=None, max_interaction_bins=32, min_samples_leaf=2, min_hessian=0.001, reg_alpha=0.0, reg_lambda=0.0, max_delta_step=0.0, objective=None)#
运行FAST算法并返回排名后的交互及其强度作为字典。
- Parameters:
X – 训练样本的数组
y – 训练目标的数组
interactions – 要评估的交互 可以是一个特征索引的元组列表,或者是一个整数,表示返回的最大对数。 None 表示评估所有成对交互
init_score – 可以生成分数的模型或每个样本的初始化分数。 如果是样本分数,它应该与X和y的长度相同。
sample_weight – 每个样本的可选权重数组。应与X和y的长度相同
feature_names – 特征名称列表
feature_types – 特征类型的列表,例如“连续”或“名义”
max_interaction_bins – 每个交互项的最大分箱数
min_samples_leaf – 计算增益时用于树分裂的最小样本数
min_hessian – 考虑潜在分割有效所需的最小hessian值
reg_alpha – L1 正则化。
reg_lambda – L2 正则化。
max_delta_step – 用于限制树叶子节点的最大输出。<=0.0 表示无约束。
目标 – 无 (rmse 或 log_loss), “rmse” (回归默认), “log_loss” (分类默认), “泊松偏差”, “特威迪偏差:方差幂=1.5”, “伽马偏差”, “伪胡伯:delta=1.0”, “rmse_log” (带有对数链接函数的rmse)
- Returns:
- 包含特征索引元组和交互强度的列表,
例如 [((1, 2), 0.134), ((3, 7), 0.0842)]。按交互强度递减排序。