版本 0.6.0 (2011年11月25日)#

新功能#

  • 添加 melt 函数到 pandas.core.reshape

  • 添加 level 参数以按级别对 Series 和 DataFrame 描述性统计进行分组 (GH 313)

  • 新增 headtail 方法到 Series,类似于 DataFrame (GH 296)

  • 新增 Series.isin 函数,该函数检查每个值是否包含在传递的序列中 (GH 289)

  • 添加 float_format 选项到 Series.to_string

  • 添加 skip_footer (GH 291) 和 converters (GH 343) 选项到 read_csvread_table

  • 新增 drop_duplicatesduplicated 函数,分别用于删除重复的 DataFrame 行和检查重复行 (GH 319)

  • 已实现 运算符 ‘&’, ‘|’, ‘^’, ‘-’ 在 DataFrame 上 (GH 347)

  • 新增 Series.mad,平均绝对偏差

  • 新增 QuarterEnd DateOffset (GH 321)

  • 添加 dot 到 DataFrame (GH 65)

  • Panel.from_dict 中添加了 orient 选项 (GH 359, GH 301)

  • 添加 orient 选项到 DataFrame.from_dict

  • 新增 传递元组列表或列表列表到 DataFrame.from_records (GH 357)

  • 添加 了多个层级到 groupby (GH 103)

  • 允许 by 参数中的 DataFrame.sort_index 多列 (GH 92, GH 362)

  • 添加 了快速的 get_valueput_value 方法到 DataFrame (GH 360)

  • 在 Series 和 DataFrame 中添加了 cov 实例方法 (GH 194, GH 362)

  • 添加 kind='bar' 选项到 DataFrame.plot (GH 348)

  • 添加 idxminidxmax 到 Series 和 DataFrame (GH 286)

  • 新增 read_clipboard 函数以从剪贴板解析 DataFrame (GH 300)

  • 添加 nunique 函数到 Series 用于计算唯一元素 (GH 297)

  • 制作 DataFrame 构造函数使用 Series 名称,如果没有传递列 (GH 373)

  • 支持 read_table/read_csv 中的正则表达式 (GH 364)

  • 添加 DataFrame.to_html 用于将 DataFrame 写入 HTML (GH 387)

  • 添加 了对 DataFrame 中 MaskedArray 数据的支持,掩码值转换为 NaN (GH 396)

  • 添加 DataFrame.boxplot 函数 (GH 368)

  • 可以 传递额外的参数、关键字参数给 DataFrame.apply (GH 376)

  • 实现 DataFrame.join 带有向量 on 参数 (GH 312)

  • 添加 legend 布尔标志到 DataFrame.plot (GH 324)

  • 可以 传递多个层级给 stackunstack (GH 370)

  • 可以 传递多个值列给 pivot_table (GH 381)

  • 使用 GroupBy 中的 Series 名称作为结果索引 (GH 363)

  • 新增 raw 选项到 DataFrame.apply 以提高性能,如果只需要 ndarray (GH 309)

  • 在标准和面板 OLS 中添加了经过适当测试的加权最小二乘法 (GH 303)

性能提升#

  • VBENCH 对 cache_readonly 进行了 Cython 化,从而在整个代码库中实现了显著的微性能提升 (GH 361)

  • VBENCH 特殊的 Cython 矩阵迭代器,用于应用任意归约操作,性能比 np.apply_along_axis 好 3-5 倍 (GH 309)

  • VBENCH 改进了 MultiIndex.from_tuples 的性能

  • VBENCH 特殊的 Cython 矩阵迭代器,用于应用任意归约操作

  • VBENCH + DOCUMENT 为 DataFrame.apply 添加 raw 选项以在获取更好性能时

  • VBENCH 在 Series 和 DataFrame 中通过级别进行更快的 cythonized 计数 (GH 341)

  • VBENCH? 使用多个键进行GroupBy性能显著提升,包含许多“空”组合

  • VBENCH 新的 Cython 向量化函数 map_infer 在传递逐元素 Python 函数时显著加速了 Series.applySeries.map,灵感来自 (GH 355)

  • VBENCH 显著提升了 Series.order 的性能,这也使得在 Series 上调用 np.unique 更快 (GH 327)

  • VBENCH 显著提升了在具有 MultiIndex 的轴上进行 GroupBy 操作的性能 (GH 299)

贡献者#

总共有8个人为这次发布贡献了补丁。名字后面带有“+”的人是第一次贡献补丁。

  • Adam Klein +

  • Chang She +

  • Dieter Vandenbussche

  • Jeff Hammerbacher +

  • Nathan Pinger +

  • Thomas Kluyver

  • Wes McKinney

  • Wouter Overmeire +