statsmodels.stats.oneway.anova_oneway¶
-
statsmodels.stats.oneway.anova_oneway(data, groups=
None, use_var='unequal', welch_correction=True, trim_frac=0)[source]¶ 单因素方差分析
这实现了标准的方差分析、Welch 和 Brown-Forsythe,以及修剪(Yuen)变体。
- Parameters:¶
- data
tupleofarray_like orDataFrameorSeries k个独立样本的数据,其中k >= 2。 数据可以以数组元组或列表的形式提供,或者在长格式中,结果观测值在
data中,组别成员在groups中。- groups
ndarrayorSeries 如果数据是长格式,则需要使用groups作为指示器来指示数据属于哪个组或样本以及观察值。
- use_var{“unequal”, “equal” or “bf”}
use_var 指定了如何处理样本间的异方差性,即不等的方差。有三种方法可供选择
- “unequal”Variances are not assumed to be equal across samples.
异方差性通过Welch方差分析和Satterthwaite-Welch自由度来考虑。 这是默认设置。
- “equal”Variances are assumed to be equal across samples.
这是标准的方差分析。
- “bf”Variances are not assumed to be equal across samples.
该方法是Browne-Forsythe(1971)用于检验均值相等的方法,并由Merothra修正了自由度。原始BF自由度作为附加属性在结果实例中可用,
df_denom2和p_value2。
- welch_correctionbool
如果这是false,则不会包含对检验统计量的Welch校正。这允许计算一个更接近Cohen’s f的效果量度量。
- trim_frac
floatin[0, 0.5) 可选的修剪用于带有修剪均值和温莎化方差的方差分析。 默认的trim_frac等于零时,单因素方差分析统计量 不进行修剪计算。如果trim_frac大于零, 则每个样本中的最大和最小观测值将被修剪。 修剪的观测值数量是样本中观测值数量的分数, 截断到下一个较低的整数。 trim_frac必须小于0.5,然而,如果分数 太大以至于剩余的观测值不足,则将返回nan。
- data
- Returns:¶
- res
resultsinstance 返回的 HolderTuple 实例具有以下主要属性,以及其他属性中的一些附加信息。
- statisticfloat
用于k样本均值比较的检验统计量,近似于F分布。
- pvaluefloat
如果
use_var="bf",则 p 值基于 Mehrotra 1997 年提出的校正自由度。- pvalue2float
这是基于自由度的p值,如Brown-Forsythe 1974年所述,仅在
use_var="bf"时可用。- df = (df_denom, df_num)tuple of floats
F-分布的自由度取决于
use_var。 如果use_var="bf",那么df_denom 用于 Mehrotra p 值 df_denom2 可用于 Brown-Forsythe 1974 p 值。 df_num 是两者的相同分子自由度。
- res
另请参阅
注释
Welch’s anova 在小样本中如果样本分布与正态分布相差不大时,其检验结果是正确的(既不宽松也不保守)。如果数据严重偏斜,检验结果可能会变得宽松。Welch’s Anova 对于有限支持的离散分布(如Lickert量表数据)也可以正确地进行检验。修剪版本对许多非正态分布具有鲁棒性,在许多情况下保持正确的检验结果,并且在某些具有偏斜或重尾的情况下更具功效。
修剪目前基于
nobs * trim_frac的整数部分。 默认值可能会更改为包括原始文章中Yuen所描述的分数观测值。参考文献
布朗, 莫顿·B., 和 艾伦·B. 福赛思. 1974. “检验多个均值相等性的一些统计量的小样本行为.” Technometrics 16 (1) (2月1日): 129–132. doi:10.2307/1267501.
Mehrotra, Devan V. 1997. “改进Brown-Forsythe对广义Behrens-Fisher问题的解决方案。” 统计通讯 - 模拟与计算 26 (3): 1139–1145. doi:10.1080/03610919708813431.