1.0.4 版本的新内容 (2020年5月28日)#
这些是 pandas 1.0.4 中的更改。请参阅 发行说明 以获取包括其他版本 pandas 的完整更新日志。
修复的回归问题#
修复了当
pandas.options.mode.use_inf_as_na设置为True时,Series.isna()和DataFrame.isna()会为分类数据类型引发的问题 (GH 33594)修复了
DataFrameGroupBy.first()、SeriesGroupBy.first()、DataFrameGroupBy.last()和SeriesGroupBy.last()中的回归问题,其中对象 dtype 中的 None 未被保留 (GH 32800)修复在使用
numeric_only=True和 ExtensionArrays 进行 DataFrame 缩减时的回归问题 (GH 33256)。修复了
memory_usage(deep=True)在对象类型中的性能退化问题 (GH 33012)修复了
Categorical.replace()会在新值和替换值相等时替换为NaN的回归问题 (GH 33288)修复回归问题,当包含仅
NaN值的有序Categorical在取最小值或最大值时会引发异常,而不是返回NaN(GH 33450)修复了在
DataFrameGroupBy.agg()中使用字典输入时丢失ExtensionArraydtypes 的回归问题 (GH 32194)修复以保留使用 xarray 的 CFTimeIndex(一个
Index子类)的“nearest”方法进行索引的能力(pydata/xarray#3751, GH 32905)。修复了
DataFrame.describe()引发TypeError: unhashable type: 'dict'的回归问题 (GH 32409)修复了
DataFrame.replace()中的回归问题,如果to_replace中的项目不在值中,则将列转换为object数据类型 (GH 32988)修复
Series.groupby()中在按PeriodIndex级别分组时会引发ValueError的回归问题 (GH 34010)修复了
DataFrameGroupBy.rolling.apply()和SeriesGroupBy.rolling.apply()忽略 args 和 kwargs 参数的问题 (GH 33433)修复在使用
np.min或np.max对未排序的Categorical时错误信息中的回归问题 (GH 33115)修复了在提供
datetime64[ns, tz]值时DataFrame.loc()和Series.loc()抛出错误的问题 (GH 32395)
错误修复#
在应用于可空布尔值时,
SeriesGroupBy.first(),SeriesGroupBy.last(),SeriesGroupBy.min(), 和SeriesGroupBy.max()返回浮点数的错误 (GH 33071)Rolling.min()和Rolling.max()中的错误:在使用固定窗口 (GH 30726) 后多次调用时内存使用量增加在
to_parquet()中的错误在写入具有无效凭据的私有 s3 桶时没有引发PermissionError。(GH 27679)read_parquet()中的错误在传递 s3 目录路径时会引发FileNotFoundError。 (GH 26388)to_parquet()中的一个 Bug 在将分区 parquet 文件写入 s3 时抛出了一个AttributeError(GH 27596)DataFrameGroupBy.quantile()和SeriesGroupBy.quantile()中的错误导致当by轴包含NaN时,分位数发生偏移 (GH 33200, GH 33569)
贡献者#
总共有18人为此版本贡献了补丁。名字后面带有“+”的人首次贡献了补丁。
Daniel Saxton
JDkuba +
Joris Van den Bossche
Kaiqi Dong
Mabel Villalba
MeeseeksMachine
MomIsBestFriend
Pandas Development Team
Simon Hawkins
Spencer Clark +
Tom Augspurger
Vikas Pandey +
alimcmaster1
h-vishal +
jbrockmendel
mproszewska +
neilkg +
rebecca-palmer +