1.4.4 版本的新特性 (2022年8月31日)#
这是 pandas 1.4.4 中的更改。请参阅 发行说明 以获取包括其他版本 pandas 的完整更新日志。
修复的回归问题#
修复了
DataFrame.fillna()在具有MultiIndex的DataFrame上无法正常工作的问题 (GH 47649)修复了从
DataFrame中获取 NULL对象时导致的段错误。这些 NULL 值是由numpy.empty_like()创建的 (GH 46848)修复了在
concat()中即使Index已经排序,在排序过程中仍然物化Index的回归问题 (GH 47501)修复了在处理带有自定义属性的全NaN ExtensionArrays时,
concat()或merge()中的回归问题 (GH 47762)修复了在 Index 对象上调用位运算 numpy ufuncs(例如
np.bitwise_and)时的回归问题 (GH 46769)在使用
datetime64IntervalIndex 作为 bins 时,修复了cut()中的回归问题 (GH 46218)修复了
DataFrame.select_dtypes()中的回归问题,其中include="number"包含了BooleanDtype(GH 46870)修复了在用
NamedTuple索引时DataFrame.loc()引发错误的问题 (GH 48124)修复了
DataFrame.loc()在设置值后未正确更新缓存的问题 (GH 47867)修复了在某些情况下使用
DataFrame.loc()设置DataFrame时索引未对齐的问题 (GH 47578)修复了在
DataFrame.loc()中将长度为1的数组类值设置为DataFrame中的单个值时的回归问题 (GH 46268)在使用
DatetimeIndex和DateOffset对象作为其freq时,修复了使用DataFrame.loc()进行切片时的回归问题 (GH 46671)在使用掩码将
None或非字符串值设置到string类型的 Series 中时修复了回归问题 (GH 47628)修复了通过 Series
__setitem__更新 DataFrame 列时(使用链式赋值)不就地更新列值并使用过多内存的问题 (GH 47172)修复了
DataFrame.select_dtypes()返回原始 DataFrame 视图的回归问题 (GH 48090)使用自定义索引子类(例如,在 xarray 中使用)修复了
reset_index()或Index.insert()的回归问题 (GH 47071)修复了当
DatetimeIndex包含跨越夏令时的日期时,intersection()中的回归问题 (GH 46702)修复了在
DataFrame.eval()中就地更新时创建副本的回归问题 (GH 47449)修复了使用
SparseDtype和DataFrame.iloc()获取行时会引发的问题 (GH 46406)
错误修复#
在
read_csv()中将参数(filepath_or_buffer除外)作为位置参数传递时引发的FutureWarning现在在正确的堆栈级别引发 (GH 47385)当
method是一个不返回int并会引发TypeError的callable时,DataFrame.to_sql()中的错误 (GH 46891)在
DataFrameGroupBy.value_counts()中的错误,其中subset没有效果 (GH 46383)在使用
DataFrame.loc()获取值时出现的错误,使用一组键会导致内部不一致,这可能导致frame.at[x, y]与frame[y].loc[x]之间的断开 (GH 22372)在
Series.dt.strftime()访问器中的错误,对于所有-NaT输入返回一个浮点数而不是对象类型系列,这也导致了一个虚假的弃用警告 (GH 45858)
其他#
编译 pandas 所需的 Cython 最低版本现在是
0.29.32(GH 47978)
贡献者#
总共有12个人为这次发布贡献了补丁。名字后面有“+”的人第一次贡献了补丁。
Jeff Reback
Joris Van den Bossche
Marco Edward Gorelli
Matthew Roeschke
MeeseeksMachine
Nima Sarang +
Pandas Development Team
Patrick Hoefler
Simon Hawkins
Tobias Pitters
Xingrong Chen +
jbrockmendel