statsmodels.discrete.truncated_model.HurdleCountModel.predict

HurdleCountModel.predict(params, exog=None, exposure=None, offset=None, which='mean', y_values=None)[source]

根据外生变量预测响应变量或其他统计量。

Parameters:
paramsarray_like

模型的参数。

exogndarray, optional

主计数模型的解释变量。 如果 exog 为 None,则将使用模型中的数据。

exog_inflndarray, optional

零膨胀模型的解释变量。 exog_infl 必须在 exog 提供的情况下提供,除非 exog_infl 在模型中仅是一个常数。

offsetndarray, optional

偏移量被添加到均值函数的线性预测器中,系数等于1。 如果exog不为None,则默认值为零;如果exog为None,则默认值为模型偏移量。

exposurendarray, optional

Log(exposure) 被添加到线性预测器中,系数等于1。如果指定了exposure,则该方法会对其进行对数化处理。用户不需要先对其进行对数化处理。如果exog不为None,则默认值为1;如果exog为None,则默认值为模型的exposure。

whichstr (optional)

要预测的统计量。默认是‘均值’。

  • ‘mean’ : 因变量的条件期望 E(y | x)

  • ‘mean-main’ : 截断计数模型的均值参数。 注意,这不是截断分布的均值。

  • ‘linear’ : 截断计数模型的线性预测器。

  • ‘var’ : 返回模型所隐含的endog的估计方差。

  • ‘prob-main’ : 选择主模型的概率,即观察到非零计数的概率 P(y > 0 | x)。

  • ‘prob-zero’ : 观察到零计数的概率。P(y=0 | x). 这等于 1 - prob-main

  • ‘prob-trunc’ : 截断计数模型的截断概率。这是由截断模型隐含的观察到零计数的概率。

  • ‘mean-nonzero’ : 预期值条件是观测值大于零,E(y | X, y>0)

  • ‘prob’ : 每个计数从0到max(endog)的概率,或者如果提供了y_values,则为这些值的概率。这是一个多元返回(当预测多个观测值时为2维)。

y_valuesarray_like

随机变量 endog 的值,在这些值上计算 pmf。 仅在 which="prob" 时使用

Returns:
predicted values

注释

‘prob-zero’ / ‘prob-trunc’ 是 hurdle 模型和截断计数模型之间观察到零计数的概率比率。如果这个比率大于一,那么 hurdle 模型相比计数模型有更多的零计数。如果它小于一,那么零计数的数量是减少的。


Last update: Oct 16, 2024