f_classif#

sklearn.feature_selection.f_classif(X, y)#

计算提供的样本的ANOVA F值。

更多信息请参阅用户指南。

Parameters:

X{array-like, sparse matrix} 形状为 (n_samples, n_features): 将依次测试的一组回归变量。
yarray-like 形状为 (n_samples,): 目标向量。

Returns:

f_statisticndarray 形状为 (n_features,): 每个特征的F统计量。
p_valuesndarray 形状为 (n_features,): 与F统计量相关的P值。

See also

chi2: 分类任务中非负特征的卡方统计量。
f_regression: 回归任务中标签/特征之间的F值。

Examples

>>> from sklearn.datasets import make_classification
>>> from sklearn.feature_selection import f_classif
>>> X, y = make_classification(
...     n_samples=100, n_features=10, n_informative=2, n_clusters_per_class=1,
...     shuffle=False, random_state=42
... )
>>> f_statistic, p_values = f_classif(X, y)
>>> f_statistic
array([2.2...e+02, 7.0...e-01, 1.6...e+00, 9.3...e-01,
       5.4...e+00, 3.2...e-01, 4.7...e-02, 5.7...e-01,
       7.5...e-01, 8.9...e-02])
>>> p_values
array([7.1...e-27, 4.0...e-01, 1.9...e-01, 3.3...e-01,
       2.2...e-02, 5.7...e-01, 8.2...e-01, 4.5...e-01,
       3.8...e-01, 7.6...e-01])

Gallery examples#

ANOVA SVM 管道

单变量特征选择

SVM-Anova：带有单变量特征选择的SVM