statsmodels.stats.weightstats.DescrStatsW.quantile

DescrStatsW.quantile(probs, return_pandas=True)[source]

计算加权样本的分位数。

Parameters:
probsarray_like

一个概率点的向量,用于计算分位数。probs 的每个元素应落在 [0, 1] 范围内。

return_pandasbool

如果为真,返回值是 Pandas DataFrame 或 Series。 否则返回一个 ndarray。

Returns:
quantilesSeries, DataFrame, or ndarray
If return_pandas = True, returns one of the following:
  • 数据是1维的,return_pandas = True: 一个由概率点索引的Series。

  • 数据是二维的,return_pandas = True: 一个DataFrame,行索引为概率点,列索引为变量。

如果 return_pandas = False,返回一个包含与 Series/DataFrame 相同值的 ndarray。

注释

要计算分位数,首先,权重在精确的相同值上求和,得到不同的数据值 y_1 < y_2 < …,以及相应的权重 w_1, w_2, …。设 s_j 表示前 j 个权重的和,W 表示所有权重的和。对于概率点 p,如果 pW 严格落在 s_j 和 s_{j+1} 之间,则估计的分位数是 y_{j+1}。如果 pW = s_j,则估计的分位数是 (y_j + y_{j+1})/2。如果 pW < p_1,则估计的分位数是 y_1。

参考文献

SAS 加权分位数文档:

https://support.sas.com/documentation/cdl/en/procstat/63104/HTML/default/viewer.htm#procstat_univariate_sect028.htm


Last update: Oct 16, 2024