0.5.0 之前的发布历史¶
0.5.0¶
主要变更和新增内容 * 添加 patsy 依赖
兼容性和弃用
清理导入路径 (lowess)
Bug 修复
工具的输入形状。isestimable
增强功能和新增内容
基于patsy的公式集成(新增依赖)
时间序列分析 - ARIMA 建模 - 基于 pandas datetime 处理的增强预测
离散模型的扩展边际
OLS 异常值测试
经验似然 - Google Summer of Code 2012项目 - 描述性统计的推断 - 回归模型的推断 - 加速失效时间模型
扩展概率图
改进的图形 - plotcorr - acf 和 pacf
新数据集
新改进的工具 - numdiff 数值微分
0.4.3¶
与0.4.2相比,唯一的更改是为了与python 3.2.3兼容(更改了2to3的行为)
0.4.2¶
这是一个错误修复版本,主要影响大端序机器。
Bug 修复
discrete_model.MNLogit 修复 summary 方法
tsa.filters.hp_filter 在大端机上不使用 umfpack(scipy 错误)
剩余的修复在测试套件中,可能是某些机器上的精度问题或大端机器上的错误测试。
0.4.1¶
这是一个向后兼容(根据我们的测试套件)的版本,包含错误修复和代码清理。
Bug 修复
构建和分发修复
低阶多项式回归校正距离计算
广义模型校正 CDF链接导数
adfuller _autolag 正确计算最佳滞后值
het_arch, het_lm : 修复 autolag 和 store 选项
GLSAR: 滞后大于1时的白化不正确
其他更改
将lowess和其他功能添加到API和文档中
重命名lowess模块(旧的导入路径将在下个版本中移除)
新的稳健三明治协方差估计器,已从沙盒中移出
与 pandas 0.8 的兼容性
statsmodels.graphics 中的新图表 - ABLine 图 - 交互图
0.4.0¶
主要变化和新增内容
添加了 pandas 依赖。
如果存在cython和编译器,Cython源代码会自动构建
支持在时间序列模型中使用日期
改进的图表 - 小提琴图 - 豆图 - QQ图
添加了lowess函数
支持pandas Series和DataFrame对象。如果模型使用pandas对象进行拟合,结果实例将返回pandas对象。
完全兼容 Python 3
修复genfromdta中的错误。将Stata .dta格式转换为结构化数组,保留所有类型。转换速度现在快得多。
改进的文档
模型和结果可以通过保存/加载进行序列化,可以选择保存模型数据。
核密度估计现在使用Cython,速度显著提升。
OLS中的异常值和影响统计的诊断
添加了厄尔尼诺海表温度数据集
众多错误修复
内部代码重构
改进了文档,包括作为HTML一部分的示例
破坏向后兼容性的更改
已弃用的scikits命名空间。现在推荐的导入方式是:
import statsmodels.api as smmodel.predict 方法的签名现在是 (params, exog, …),而在之前它假设模型已经被拟合并省略了 params 参数。
为了与其他多方程模型保持一致,MNLogit 的参数现在进行了转置。
tools.tools.ECDF -> distributions.ECDF
tools.tools.monotone_fn_inverter -> distributions.monotone_fn_inverter
tools.tools.StepFunction -> distributions.StepFunction
0.3.1¶
移除了仅限学术使用的WFS数据集。
修复Windows上的easy_install问题。
0.3.0¶
破坏向后兼容性的更改
添加了 api.py 用于导入。因此,新的导入约定是:
import statsmodels.api as sm
直接从模块导入现在可以避免不必要的导入,并且如果库或用户只需要特定函数,可以提高导入速度。
sandbox/output.py -> iolib/table.py
lib/io.py -> iolib/foreign.py (现在包含 Stata .dta 格式读取器)
family -> families
families.links.inverse -> families.links.inverse_power
数据集的Load类现在是load函数。
regression.py -> regression/linear_model.py
discretemod.py -> discrete/discrete_model.py
rlm.py -> robust/robust_linear_model.py
glm.py -> genmod/generalized_linear_model.py
model.py -> base/model.py
t() 方法 -> tvalues 属性 (t() 仍然存在但会引发警告)
主要变化和新增内容
众多错误修复。
时间序列分析模型 (tsa)
向量自回归模型 VAR (tsa.VAR)
自回归模型 AR (tsa.AR)
自回归移动平均模型 ARMA (tsa.ARMA) 可选使用 Cython 进行卡尔曼滤波 使用 setup.py install 并带选项 –with-cython
Baxter-King 带通滤波器 (tsa.filters.bkfilter)
Hodrick-Prescott 滤波器 (tsa.filters.hpfilter)
Christiano-Fitzgerald 滤波器 (tsa.filters.cffilter)
改进的最大似然框架使用所有可用的 scipy.optimize 求解器
重构数据集子包。
增加了更多数据集用于示例。
移除了运行测试套件的RPy依赖。
重构了测试套件。
重构了代码库/目录结构。
支持在GLM中的偏移和曝光。
删除了用于二项式模型的GLM.fit中的data_weights参数。
新的统计检验方法,特别是诊断和规范性检验
多重检验校正
沙盒中的广义矩方法框架
改进的文档
以及其他新增内容
0.2.0¶
主要变化
为了更一致性而重命名 RLM.fitted_values -> RLM.fittedvalues GLMResults.resid_dev -> GLMResults.resid_deviance
GLMResults, RegressionResults: 惰性计算,将属性转换为带有_cache的属性
修复测试以在没有 rpy 的情况下运行
扩展示例在示例目录中
将 PyDTA 添加到 lib.io – 用于读取 Stata .dta 二进制文件并将其转换为 numpy 数组的函数
使 tools.categorical 更加健壮
add_constant 现在接受一个 prepend 参数
修复 GLS 以仅适用于单列设计
新
添加四个新数据集
来自美国国家选举研究(1996年)的数据集
格伦菲尔德(1950)投资数据
Spector 和 Mazzeo (1980) 项目效果数据
一个美国宏观经济数据集
为具有离散因变量的模型添加四个新的最大似然估计器,并附示例
逻辑回归
概率单位
MNLogit(多项逻辑回归)
泊松
沙盒
在sandbox.graphics中添加qqplot
添加 sandbox.tsa(时间序列分析)和 sandbox.regression(方差分析)
在sandbox.tools中添加主成分分析
在sandbox.sysreg.Sem2SLS中为方程组添加看似不相关的回归(SUR)和两阶段最小二乘法
添加受限最小二乘法 (RLS)
0.1.0b1¶
初始版本