2.0.2 版本的新内容(2023年5月29日)#
这是 pandas 2.0.2 的更改。请参阅 发行说明 以获取包括其他版本 pandas 的完整更新日志。
修复的回归问题#
修复了
GroupBy.apply()中的性能退化问题 (GH 53195)在Windows上修复了当dtype为``np.intc``时:func:merge`的回归问题 (:issue:`52451)
修复了
read_sql()在重复列名的情况下删除列的回归问题 (GH 53117)修复了在扩展对象时
DataFrame.loc()丢失MultiIndex名称的回归问题 (GH 53053)修复了在
DataFrame.to_string()中,当 DataFrame 不适合行宽时,在第一行数据的末尾打印反斜杠而不是标题的问题 (GH 53054)修复了
MultiIndex.join()返回级别顺序错误的问题 (GH 53093)
错误修复#
arrays.ArrowExtensionArray中的错误,错误地将dict而不是list分配给带有pyarrow.map_的.type,并在使用pyarrow.struct时引发NotImplementedError(GH 53328)api.interchange.from_dataframe()中的错误在空分类数据上引发IndexError(GH 53077)api.interchange.from_dataframe()中的错误在调用切片时返回了大小不正确的DataFrame(GH 52824)api.interchange.from_dataframe()中的错误在位掩码上不必要地引发 (GH 49888)在
read_csv()中,当设置engine="pyarrow"和parse_dates时引发OverflowError的错误 (GH 53295)to_datetime()中的错误在日期包含“AM”/“PM”标记时,推断格式包含"%H"而不是"%I"(GH 53147)在
to_timedelta()中的错误在使用pandas.NA时引发了ValueError(GH 52909)在
DataFrame.__getitem__()中的错误,对于MultiIndex部分键没有保留 dtypes (GH 51895)Bug in
DataFrame.convert_dtypes()忽略convert_*关键字当设置为 Falsedtype_backend="pyarrow"(GH 52872)DataFrame.convert_dtypes()中的错误导致 tz-aware dtypes 和dtype_backend="pyarrow"的时区丢失 (GH 53382)在
DataFrame.sort_values()中对 PyArrowdictionary数据类型引发错误的缺陷 (GH 53232)在
Series.describe()中处理 pyarrow 支持的时间戳和时间增量时,将其视为分类数据的问题 (GH 53001)在启用写入时复制功能时,当传递标量给
Series.rename()时,不会进行惰性复制的问题 (GH 52450)在
pd.array()中对NumPy数组和pa.large_string或pa.large_binary引发错误的缺陷 (GH 52590)
其他#
当使用
ArrowDtype调用Series.dt.to_pydatetime()时,如果类型为pyarrow.date32或pyarrow.date64,会引发一个更好的错误信息 (GH 52812)
贡献者#
总共有18人为此版本贡献了补丁。名字后面带有“+”的人首次贡献了补丁。
Gianluca Ficarelli +
Guillaume Lemaitre
Joris Van den Bossche
Julian Badillo +
Luke Manley
Lumberbot (aka Jack) +
Marc Garcia
Marco Edward Gorelli
MarcoGorelli
Matt Richards
Matthew Roeschke
MeeseeksMachine
Pandas Development Team
Patrick Hoefler
Simon Høxbro Hansen +
Thomas Li
Yao Xiao +
dependabot[bot]