sklearn.ensemble¶

sklearn.ensemble.RandomForestClassifier¶

sklearn.ensemble.RandomForestClassifier

该类提供随机森林分类器，作为一种集成学习模型，用于分布式大规模学习。

重要

random_state 的值在多节点集群运行时被忽略。

方法¶

sklearn.ensemble.RandomForestClassifier.fit¶

sklearn.ensemble.RandomForestClassifier.fit(X, y, sample_weight=None)

支持的参数

- X: NumPy 数组，Pandas 数据框，或 CSR 稀疏矩阵。 - y: NumPy 数组 - sample_weight: 数值型 NumPy 数组（仅当数据未分布时）

sklearn.ensemble.RandomForestClassifier.predict¶

sklearn.ensemble.RandomForestClassifier.predict(X)

支持的参数

- X: NumPy数组、Pandas数据框或CSR稀疏矩阵。

sklearn.ensemble.RandomForestClassifier.predict_log_proba¶

sklearn.ensemble.RandomForestClassifier.predict_log_proba(X)

支持的参数

- X: NumPy数组、Pandas数据框或CSR稀疏矩阵。

sklearn.ensemble.RandomForestClassifier.predict_proba¶

sklearn.ensemble.RandomForestClassifier.predict_proba(X)

支持的参数

- X: NumPy数组、Pandas数据框，或CSR稀疏矩阵。

sklearn.ensemble.RandomForestClassifier.score¶

sklearn.ensemble.RandomForestClassifier.score(X, y, sample_weight=None)

支持的参数

- X: NumPy数组或Pandas数据框。 - y: NumPy数组 - sample_weight: 数值型NumPy数组

示例用法¶

>>> import bodo
>>> from sklearn.ensemble import RandomForestClassifier
>>> from sklearn.datasets import make_classification
>>> X, y = make_classification(n_samples=1000, n_features=4,
...                            n_informative=2, n_redundant=0,
...                            random_state=0, shuffle=False)
>>> @bodo.jit
>>> def test_random_forest_classifier(X, y):
...   clf = RandomForestClassifier(max_depth=2)
...   clf.fit(X, y)
...   ans = clf.predict(np.array([[0, 0, 0, 0]]))
...   print(ans)
...
>>> test_random_forest_classifier(X, y)
[1]

sklearn.ensemble.RandomForestRegressor¶

sklearn.ensemble.RandomForestRegressor

该类提供随机森林回归器，一种集成学习模型，用于分布式大规模学习。

重要

random_state 的值在多节点集群运行时被忽略。

方法¶

sklearn.ensemble.RandomForestRegressor.fit¶

sklearn.ensemble.RandomForestRegressor.fit(X, y, sample_weight=None)

支持的参数

- X: NumPy数组，Pandas数据框，或CSR稀疏矩阵。 - y: NumPy数组 - sample_weight: 数值型NumPy数组（仅在数据未分布时）

sklearn.ensemble.RandomForestRegressor.predict¶

sklearn.ensemble.RandomForestRegressor.predict(X)

支持的参数

- X: NumPy数组、Pandas数据框，或CSR稀疏矩阵。

sklearn.ensemble.RandomForestRegressor.score¶

sklearn.ensemble.RandomForestRegressor.score(X, y, sample_weight=None)

支持的参数

- X: NumPy数组, Pandas数据框, 或 CSR稀疏矩阵。 - y: NumPy数组 - sample_weight: 数值型NumPy数组

示例用法¶

>>> import bodo
>>> from sklearn.ensemble import RandomForestRegressor
>>> from sklearn.datasets import make_regression
>>> X, y = make_regression(n_features=4, n_informative=2,
... random_state=0, shuffle=False)
>>> @bodo.jit
>>> def test_random_forest_regressor(X, y):
...   regr = RandomForestRegressor(max_depth=2)
...   regr.fit(X, y)
...   ans = regr.predict(np.array([[0, 0, 0, 0]]))
...   print(ans)
...
>>> test_random_forest_regressor(X, y)
[-6.7933243]