statsmodels.multivariate.pca.pca¶
-
statsmodels.multivariate.pca.pca(data, ncomp=
None, standardize=True, demean=True, normalize=True, gls=False, weights=None, method='svd')[source]¶ 执行主成分分析(PCA)。
- Parameters:¶
- data
ndarray 变量在列中,观测值在行中。
- ncomp
int,optional 要返回的组件数量。如果为 None,则返回尽可能多的组件,数量不超过数据行数或列数中的较小值。
- standardizebool,
optional 指示使用均值为0和单位方差的规范化数据的标志。标准化为True意味着去均值。
- demeanbool,
optional 指示是否在计算主成分之前对数据进行去均值处理的标志。如果 standardize 为 True,则 demean 将被忽略。
- normalizebool ,
optional 指示是否将因子归一化为具有单位内积。如果为False,则载荷将具有单位内积。
- glsbool,
optional 指示实现两步GLS估计器的标志,其中在第一步使用主成分来估计残差,然后使用残差方差的倒数作为一组权重来估计最终的主成分
- weights
ndarray,optional 在根据标准化或去均值转换数据后,用于计算主成分的系列权重。
- method
str,optional 确定使用的线性代数例程。默认情况下使用‘eig’,即特征值分解。‘svd’使用奇异值分解。
- data
- Returns:¶
- factors{
ndarray,DataFrame} 主成分的数组 (nobs, ncomp)(也称为得分)。
- loadings{
ndarray,DataFrame} 用于构建因子的主成分载荷的数组 (ncomp, nvar)。
- projection{
ndarray,DataFrame} 包含数据在估计的ncomp个因子上的投影的数组 (nobs, nvar)。
- rsquare{
ndarray,Series} 数组 (ncomp,),其中第 i 个位置的元素是包含前 i 个主成分的 R 方值。这些值是在变换后的数据上计算的,而不是原始数据。
- ic{
ndarray,DataFrame} 包含Bai和Ng(2003)信息准则的数组(ncomp, 3)。每一列是一个不同的准则,每一行表示包含的因子数量。
- eigenvals{
ndarray,Series} 特征值数组 (nvar,)。
- eigenvecs{
ndarray,DataFrame} 特征向量的数组。(nvar, nvar)。
- factors{
注释
这是一个围绕PCA类的简单函数包装器。有关更多信息和附加方法,请参阅PCA。
Last update:
Oct 16, 2024