dask_ml.ensemble.BlockwiseVotingClassifier
dask_ml.ensemble.BlockwiseVotingClassifier¶
- class dask_ml.ensemble.BlockwiseVotingClassifier(estimator, voting='hard', classes=None)[源代码]¶
块训练和集成投票分类器。
此分类器在 Dask 数组或数据帧的块/分区上进行训练。estimator 的克隆版本将*独立*拟合 Dask 集合的每个块或分区。当子估计器仅适用于像 NumPy 数组或 pandas 数据帧这样的小内存数据结构时,这非常有用。
预测是通过学习模型的 集成 完成的。
警告
在训练之前,确保你的数据已经充分打乱!如果数据集的各个块/分区的值分布不相似,分类器将会给出较差的结果。
- 参数
- 估计器估计器
- 投票str, {‘hard’, ‘soft’} (默认=’hard’)
如果为 ‘hard’,则使用预测的类别标签进行多数投票。否则,如果为 ‘soft’,则根据预测概率之和的 argmax 来预测类别标签,这在集成校准良好的分类器时推荐使用。
- 类类似列表的,可选的
y 可以取的类集合。如果底层估计器在拟合时需要 classes,这也可以作为拟合参数提供。
- 属性
- estimators_分类器列表
在输入的每个分区/块上拟合的 estimator 子估计器的集合。
- classes_类似数组,形状为 (n_predictions,)
类别标签。
示例
>>> import dask_ml.datasets >>> import dask_ml.ensemble >>> import sklearn.linear_model >>> X, y = dask_ml.datasets.make_classification(n_samples=100_000, >>> ... chunks=10_000) >>> subestimator = sklearn.linear_model.RidgeClassifier(random_state=0) >>> clf = dask_ml.ensemble.BlockwiseVotingClassifier( >>> ... subestimator, >>> ... classes=[0, 1] >>> ... ) >>> clf.fit(X, y)
方法
get_metadata_routing()获取此对象的元数据路由。
get_params([deep])获取此估计器的参数。
score(X, y[, sample_weight])返回给定测试数据和标签的平均准确率。
set_params(**params)设置此估计器的参数。
set_score_request(*[, sample_weight])传递给
score方法的请求元数据。拟合
预测