版本 0.5.0 (2011年10月24日)#

新功能#

  • 新增 DataFrame.align 方法,带有标准连接选项

  • 添加 parse_dates 选项到 read_csvread_table 方法,以选择性地尝试解析索引列中的日期

  • 添加 read_csvread_tablenrowschunksizeiterator 参数。最后两个返回一个新的 TextParser 类,能够通过平面文件的块进行惰性迭代 (GH 242)

  • 添加 了在 DataFrame.join 中按多列连接的功能 (GH 214)

  • Index 中添加了私有 _get_duplicates 函数,以便更容易地识别重复值 (ENH5c)

  • 添加 到 DataFrame 的列属性访问。

  • 添加 了 DataFrame 列的 Python 标签补全钩子。(GH 233, GH 230)

  • 已实现 Series.describe 用于包含对象的 Series (GH 241)

  • 添加 了在按键连接时 DataFrame.join 的内部连接选项 (GH 248)

  • 已实现 通过传递列表给 __getitem__ 来选择 DataFrame 列 (GH 253)

  • 已实现 & 和 | 分别用于交集 / 并集 Index 对象 (GH 261)

  • 新增 pivot_table 便捷函数到 pandas 命名空间 (GH 234)

  • 已实现 Panel.rename_axis 函数 (GH 243)

  • DataFrame 将在控制台输出中显示索引级别名称 (GH 334)

  • 已实现 Panel.take

  • 新增 set_eng_float_format 用于替代 DataFrame 浮点字符串格式化 (ENH61)

  • 新增 便捷 set_index 函数,用于从现有列创建 DataFrame 索引

  • 已实现 groupby 分层索引级别名称 (GH 223)

  • 添加 了对 DataFrame.to_csv 中不同分隔符的支持 (GH 244)

性能提升#

  • VBENCH 文件解析函数 read_csvread_table 的主要性能改进

  • VBENCH 添加了用于将元组转换为 ndarray 的 Cython 函数,速度非常快。加快了许多与 MultiIndex 相关的操作。

  • VBENCH 重构了合并/连接代码到一个整洁的类中,并在浮点/对象情况下禁用了不必要的计算,从而获得了大约 10% 的性能提升 (GH 211)

  • VBENCH 通过大约 5 倍的速度提高了混合类型 DataFrame 对象上的 DataFrame.xs 的速度,这是从 0.3.0 版本以来的回归 (GH 215)

  • VBENCH 通过新的 DataFrame.align 方法,将不同索引的 DataFrame 对象之间的二进制操作速度提高了 10-25%。

  • VBENCH 显著加快了将嵌套字典转换为 DataFrame 的速度 (GH 212)

  • VBENCH 显著加快了大型混合类型 DataFrame 对象上的 __repr__count 速度

贡献者#

共有9人为此版本贡献了补丁。名字后面带有“+”的人首次贡献了补丁。

  • Aman Thakral +

  • Luca Beltrame +

  • Nick Pentreath +

  • Skipper Seabold

  • Thomas Kluyver +

  • Wes McKinney

  • Yaroslav Halchenko +

  • lodagro +

  • unknown +