版本 0.5.0 (2011年10月24日)#
新功能#
新增
DataFrame.align方法,带有标准连接选项添加
parse_dates选项到read_csv和read_table方法,以选择性地尝试解析索引列中的日期添加
read_csv和read_table的nrows、chunksize和iterator参数。最后两个返回一个新的TextParser类,能够通过平面文件的块进行惰性迭代 (GH 242)在
Index中添加了私有_get_duplicates函数,以便更容易地识别重复值 (ENH5c)添加 到 DataFrame 的列属性访问。
DataFrame 将在控制台输出中显示索引级别名称 (GH 334)
已实现
Panel.take新增 便捷
set_index函数,用于从现有列创建 DataFrame 索引
性能提升#
VBENCH 文件解析函数
read_csv和read_table的主要性能改进VBENCH 添加了用于将元组转换为 ndarray 的 Cython 函数,速度非常快。加快了许多与 MultiIndex 相关的操作。
VBENCH 重构了合并/连接代码到一个整洁的类中,并在浮点/对象情况下禁用了不必要的计算,从而获得了大约 10% 的性能提升 (GH 211)
VBENCH 通过大约 5 倍的速度提高了混合类型 DataFrame 对象上的
DataFrame.xs的速度,这是从 0.3.0 版本以来的回归 (GH 215)VBENCH 通过新的
DataFrame.align方法,将不同索引的 DataFrame 对象之间的二进制操作速度提高了 10-25%。VBENCH 显著加快了将嵌套字典转换为 DataFrame 的速度 (GH 212)
VBENCH 显著加快了大型混合类型 DataFrame 对象上的
__repr__和count速度
贡献者#
共有9人为此版本贡献了补丁。名字后面带有“+”的人首次贡献了补丁。
Aman Thakral +
Luca Beltrame +
Nick Pentreath +
Skipper Seabold
Thomas Kluyver +
Wes McKinney
Yaroslav Halchenko +
lodagro +
unknown +