可视化

可视化#

支持interpret的可视化根据它们所处的环境使用不同的渲染器。在大多数情况下，该包会检测它所在的环境并使用适当的渲染器。但有时你可能希望强制选择其中一个。

Dash 渲染器

Dash渲染器用于本地环境，例如在您的笔记本电脑上运行Jupyter笔记本。它在第一次被interpret调用时，会在一个单独的进程中运行一个由Apache Flask支持的Dash服务器。

这提供了对笔记本中嵌入的可视化以及完整仪表板的访问。然而，由于需要实时运行的Flask服务器，它无法在离线笔记本中渲染。

查看源代码以了解其配置这里.

from interpret import set_visualize_provider
from interpret.provider import DashProvider
set_visualize_provider(DashProvider.from_address(('127.0.0.1', 7001)))

class interpret.provider.DashProvider(app_runner)#

通过Plotly的Dash提供渲染。

这在可以暴露HTTP(s)端口的环境中有效。

初始化类。

这需要一个实例化的AppRunner，调用.from_address来初始化两者。

Parameters:: app_runner – 一个AppRunner实例。

classmethod from_address(addr=None, base_url=None, use_relative_links=False)#

初始化一个新的AppRunner以及提供者。

Parameters:

addr – 一个元组，包含 (ip_addr, port)。
base_url – 基础URL，这在代理后面时非常有用。
use_relative_links – 渲染页面时使用相对链接而不是完整的URI。

内联渲染器

内联渲染器用于云环境中访问Flask服务器并不总是可用的情况。在大多数配置中，它会在每个笔记本单元格中注入JavaScript，包括捆绑包。

这不支持完整的仪表板，但它确实支持离线功能。

查看源代码以了解其配置这里.

from interpret import set_visualize_provider
from interpret.provider import InlineProvider
set_visualize_provider(InlineProvider())

class interpret.provider.InlineProvider(detected_envs=None, js_url=None)#

提供通过JavaScript在Jupyter单元格内调用的渲染功能。

初始化类。

Parameters:

detected_envs – 在interpret.utils.environment中定义的目标环境。
js_url – 如果定义了，将从给定的URL加载用于解释内联的JavaScript包。

交互性

可视化使用Interpret API，并负责显示解释和底层渲染基础设施。

使用show方法进行可视化

Interpret 提供了一个顶级方法 show，它作为渲染解释可视化的界面。根据提供的内容，它可以生成一个下拉小部件或仪表板。

显示单个解释

对于基本的使用场景，最好一次显示一个解释。渲染的小部件将提供一个下拉菜单来选择不同的可视化。例如，在全局解释的情况下，它将提供一个概述，以及每个特征的图表，如下面的代码所示：

from interpret import set_visualize_provider
from interpret.provider import InlineProvider
set_visualize_provider(InlineProvider())

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split

from interpret.glassbox import ExplainableBoostingClassifier
from interpret import show

df = pd.read_csv(
    "https://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data",
    header=None)
df.columns = [
    "Age", "WorkClass", "fnlwgt", "Education", "EducationNum",
    "MaritalStatus", "Occupation", "Relationship", "Race", "Gender",
    "CapitalGain", "CapitalLoss", "HoursPerWeek", "NativeCountry", "Income"
]
X = df.iloc[:, :-1]
y = (df.iloc[:, -1] == " >50K").astype(int)

seed = 42
np.random.seed(seed)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=seed)

ebm = ExplainableBoostingClassifier()
ebm.fit(X_train, y_train)

ExplainableBoostingClassifier()

In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook.
On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.

ebm_global = ebm.explain_global()
show(ebm_global)

在解释中显示特定的可视化

假设你在解释中寻找一个特定的可视化效果，那么你可以通过一个键作为后续函数参数来指定它。

show(ebm_global, "Age")

显示多个解释以进行比较

如果您在本地环境中运行（例如在笔记本电脑上运行Python），那么show可以暴露一个用于比较的仪表板，可以通过以下方式调用（在第一个参数中提供解释列表）：

from interpret.glassbox import LogisticRegression

# We have to transform categorical variables to use Logistic Regression
X_train = pd.get_dummies(X_train, prefix_sep='.').astype(float)

lr = LogisticRegression(random_state=seed, penalty='l1', solver='liblinear')
lr.fit(X_train, y_train)

lr_global = lr.explain_global()

show([ebm_global, lr_global])

解释API

该API负责标准化机器学习可解释性解释器和解释，为用户和开发者提供一致的接口。为了支持这一点，它还提供了支持可视化和数据访问的基础顶级方法。

解释器是玻璃盒或黑盒算法，它们将生成一个解释，这是一个准备好用于可视化或进一步数据处理的工件。

解释器

解释器将从其.explain_*方法生成解释。这些解释通常提供对全局模型行为或局部个别预测的理解（分别是.explain_global和.explain_local）。

class interpret.api.base.ExplainerMixin#

An object that computes explanations.: 这是InterpretML所需的合同。

Variables:

available_explanations – 一个字符串列表，包含以下子集 - “perf”, “data”, “local”, “global”.
explainer_type – 一个字符串，可以是以下之一 - “blackbox”, “model”, “specific”, “data”, “perf”.

解释

解释是一个自包含的对象，有助于理解其目标模型行为或一组个别预测。解释应通过.visualize提供对可视化的访问，并通过.data方法进行数据处理。.visualize和.data在参数方面应共享相同的函数签名。

class interpret.api.base.ExplanationMixin#

The result of calling explain_* from an Explainer. Responsible for providing data and/or visualization.: 这是InterpretML所需的合同。

Variables:

explanation_type – 一个字符串，表示解释器可用的解释类型之一。应为“perf”、“data”、“local”、“global”之一。
name – 一个字符串，表示用于显示的解释的名称。
selector – 一个可选的数据框，用于描述数据。数据框的每一行对应一个相应的数据项。

abstract data(key=None)#

提供具体的解释数据。

Parameters:: key – 一个数字/字符串，用于引用特定的数据项。
Returns:: 一个可序列化的字典。

abstract visualize(key=None)#

提供交互式可视化。

Parameters:: key – 可以是标量或列表，用于索引内部对象以进行子图绘制。如果请求整体可视化，请传递 None。
Returns:: 一个Plotly图表，html作为字符串，或一个Dash组件。

显示

show 方法被用作一个通用函数，用于为其参数中提供的任何解释提供可视化。在实现上，它将提供一些可视化平台（例如仪表板或小部件），并通过 .visualize 调用展示解释的可视化。