0.5.0 之前的发布历史

0.5.0

主要变更和新增内容 * 添加 patsy 依赖

兼容性和弃用

  • 清理导入路径 (lowess)

Bug 修复

  • 工具的输入形状。isestimable

增强功能和新增内容

  • 基于patsy的公式集成(新增依赖)

  • 时间序列分析 - ARIMA 建模 - 基于 pandas datetime 处理的增强预测

  • 离散模型的扩展边际

  • OLS 异常值测试

  • 经验似然 - Google Summer of Code 2012项目 - 描述性统计的推断 - 回归模型的推断 - 加速失效时间模型

  • 扩展概率图

  • 改进的图形 - plotcorr - acf 和 pacf

  • 新数据集

  • 新改进的工具 - numdiff 数值微分

0.4.3

与0.4.2相比,唯一的更改是为了与python 3.2.3兼容(更改了2to3的行为)

0.4.2

这是一个错误修复版本,主要影响大端序机器。

Bug 修复

  • discrete_model.MNLogit 修复 summary 方法

  • tsa.filters.hp_filter 在大端机上不使用 umfpack(scipy 错误)

  • 剩余的修复在测试套件中,可能是某些机器上的精度问题或大端机器上的错误测试。

0.4.1

这是一个向后兼容(根据我们的测试套件)的版本,包含错误修复和代码清理。

Bug 修复

  • 构建和分发修复

  • 低阶多项式回归校正距离计算

  • 广义模型校正 CDF链接导数

  • adfuller _autolag 正确计算最佳滞后值

  • het_arch, het_lm : 修复 autolag 和 store 选项

  • GLSAR: 滞后大于1时的白化不正确

其他更改

  • 将lowess和其他功能添加到API和文档中

  • 重命名lowess模块(旧的导入路径将在下个版本中移除)

  • 新的稳健三明治协方差估计器,已从沙盒中移出

  • 与 pandas 0.8 的兼容性

  • statsmodels.graphics 中的新图表 - ABLine 图 - 交互图

0.4.0

主要变化和新增内容

  • 添加了 pandas 依赖。

  • 如果存在cython和编译器,Cython源代码会自动构建

  • 支持在时间序列模型中使用日期

  • 改进的图表 - 小提琴图 - 豆图 - QQ图

  • 添加了lowess函数

  • 支持pandas Series和DataFrame对象。如果模型使用pandas对象进行拟合,结果实例将返回pandas对象。

  • 完全兼容 Python 3

  • 修复genfromdta中的错误。将Stata .dta格式转换为结构化数组,保留所有类型。转换速度现在快得多。

  • 改进的文档

  • 模型和结果可以通过保存/加载进行序列化,可以选择保存模型数据。

  • 核密度估计现在使用Cython,速度显著提升。

  • OLS中的异常值和影响统计的诊断

  • 添加了厄尔尼诺海表温度数据集

  • 众多错误修复

  • 内部代码重构

  • 改进了文档,包括作为HTML一部分的示例

破坏向后兼容性的更改

  • 已弃用的scikits命名空间。现在推荐的导入方式是:

    import statsmodels.api as sm
    
  • model.predict 方法的签名现在是 (params, exog, …),而在之前它假设模型已经被拟合并省略了 params 参数。

  • 为了与其他多方程模型保持一致,MNLogit 的参数现在进行了转置。

  • tools.tools.ECDF -> distributions.ECDF

  • tools.tools.monotone_fn_inverter -> distributions.monotone_fn_inverter

  • tools.tools.StepFunction -> distributions.StepFunction

0.3.1

  • 移除了仅限学术使用的WFS数据集。

  • 修复Windows上的easy_install问题。

0.3.0

破坏向后兼容性的更改

添加了 api.py 用于导入。因此,新的导入约定是:

import statsmodels.api as sm

直接从模块导入现在可以避免不必要的导入,并且如果库或用户只需要特定函数,可以提高导入速度。

  • sandbox/output.py -> iolib/table.py

  • lib/io.py -> iolib/foreign.py (现在包含 Stata .dta 格式读取器)

  • family -> families

  • families.links.inverse -> families.links.inverse_power

  • 数据集的Load类现在是load函数。

  • regression.py -> regression/linear_model.py

  • discretemod.py -> discrete/discrete_model.py

  • rlm.py -> robust/robust_linear_model.py

  • glm.py -> genmod/generalized_linear_model.py

  • model.py -> base/model.py

  • t() 方法 -> tvalues 属性 (t() 仍然存在但会引发警告)

主要变化和新增内容

  • 众多错误修复。

  • 时间序列分析模型 (tsa)

    • 向量自回归模型 VAR (tsa.VAR)

    • 自回归模型 AR (tsa.AR)

    • 自回归移动平均模型 ARMA (tsa.ARMA) 可选使用 Cython 进行卡尔曼滤波 使用 setup.py install 并带选项 –with-cython

    • Baxter-King 带通滤波器 (tsa.filters.bkfilter)

    • Hodrick-Prescott 滤波器 (tsa.filters.hpfilter)

    • Christiano-Fitzgerald 滤波器 (tsa.filters.cffilter)

  • 改进的最大似然框架使用所有可用的 scipy.optimize 求解器

  • 重构数据集子包。

  • 增加了更多数据集用于示例。

  • 移除了运行测试套件的RPy依赖。

  • 重构了测试套件。

  • 重构了代码库/目录结构。

  • 支持在GLM中的偏移和曝光。

  • 删除了用于二项式模型的GLM.fit中的data_weights参数。

  • 新的统计检验方法,特别是诊断和规范性检验

  • 多重检验校正

  • 沙盒中的广义矩方法框架

  • 改进的文档

  • 以及其他新增内容

0.2.0

主要变化

  • 为了更一致性而重命名 RLM.fitted_values -> RLM.fittedvalues GLMResults.resid_dev -> GLMResults.resid_deviance

  • GLMResults, RegressionResults: 惰性计算,将属性转换为带有_cache的属性

  • 修复测试以在没有 rpy 的情况下运行

  • 扩展示例在示例目录中

  • 将 PyDTA 添加到 lib.io – 用于读取 Stata .dta 二进制文件并将其转换为 numpy 数组的函数

  • 使 tools.categorical 更加健壮

  • add_constant 现在接受一个 prepend 参数

  • 修复 GLS 以仅适用于单列设计

  • 添加四个新数据集

    • 来自美国国家选举研究(1996年)的数据集

    • 格伦菲尔德(1950)投资数据

    • Spector 和 Mazzeo (1980) 项目效果数据

    • 一个美国宏观经济数据集

  • 为具有离散因变量的模型添加四个新的最大似然估计器,并附示例

    • 逻辑回归

    • 概率单位

    • MNLogit(多项逻辑回归)

    • 泊松

沙盒

  • 在sandbox.graphics中添加qqplot

  • 添加 sandbox.tsa(时间序列分析)和 sandbox.regression(方差分析)

  • 在sandbox.tools中添加主成分分析

  • 在sandbox.sysreg.Sem2SLS中为方程组添加看似不相关的回归(SUR)和两阶段最小二乘法

  • 添加受限最小二乘法 (RLS)

0.1.0b1

  • 初始版本


Last update: Oct 16, 2024