dask_ml.ensemble.BlockwiseVotingClassifier

`dask_ml.ensemble`.BlockwiseVotingClassifier¶

class dask_ml.ensemble.BlockwiseVotingClassifier(estimator, voting='hard', classes=None)[源代码]¶

块训练和集成投票分类器。

此分类器在 Dask 数组或数据帧的块/分区上进行训练。estimator 的克隆版本将*独立*拟合 Dask 集合的每个块或分区。当子估计器仅适用于像 NumPy 数组或 pandas 数据帧这样的小内存数据结构时，这非常有用。

预测是通过学习模型的集成完成的。

警告

在训练之前，确保你的数据已经充分打乱！如果数据集的各个块/分区的值分布不相似，分类器将会给出较差的结果。

参数

估计器估计器
投票str, {‘hard’, ‘soft’} (默认=’hard’): 如果为 ‘hard’，则使用预测的类别标签进行多数投票。否则，如果为 ‘soft’，则根据预测概率之和的 argmax 来预测类别标签，这在集成校准良好的分类器时推荐使用。
类类似列表的，可选的: y 可以取的类集合。如果底层估计器在拟合时需要 classes，这也可以作为拟合参数提供。

属性

estimators_分类器列表: 在输入的每个分区/块上拟合的 estimator 子估计器的集合。
classes_类似数组，形状为 (n_predictions,): 类别标签。

示例

>>> import dask_ml.datasets
>>> import dask_ml.ensemble
>>> import sklearn.linear_model
>>> X, y = dask_ml.datasets.make_classification(n_samples=100_000,
>>> ...                                         chunks=10_000)
>>> subestimator = sklearn.linear_model.RidgeClassifier(random_state=0)
>>> clf = dask_ml.ensemble.BlockwiseVotingClassifier(
>>> ...     subestimator,
>>> ...     classes=[0, 1]
>>> ... )
>>> clf.fit(X, y)

方法

`get_metadata_routing`()	获取此对象的元数据路由。
`get_params`([deep])	获取此估计器的参数。
`score`(X, y[, sample_weight])	返回给定测试数据和标签的平均准确率。
`set_params`(**params)	设置此估计器的参数。
`set_score_request`(*[, sample_weight])	传递给 `score` 方法的请求元数据。

拟合
预测

__init__(estimator, voting='hard', classes=None)[源代码]¶

dask_ml.model_selection.InverseDecaySearchCV

dask_ml.ensemble.BlockwiseVotingRegressor

dask_ml.ensemble.BlockwiseVotingClassifier

dask_ml.ensemble.BlockwiseVotingClassifier¶

`dask_ml.ensemble`.BlockwiseVotingClassifier¶