statsmodels.datasets.get_rdataset

statsmodels.datasets.get_rdataset(dataname, package='datasets', cache=False)[source]

下载并返回 R 数据集

Parameters:
datanamestr

您想要下载的数据集的名称

packagestr

数据集所在的包。默认是核心的‘datasets’包。

cachebool or str

如果为真,将把此数据下载到 STATSMODELS_DATA 文件夹中。默认位置是用户主文件夹中名为 statsmodels_data 的文件夹。否则,您可以指定一个路径到用于缓存数据的文件夹。如果为假,数据将不会被缓存。

Returns:
datasetDataset

一个 statsmodels.data.utils.Dataset 实例。该对象具有以下属性:

  • 数据 - 包含数据的 pandas DataFrame

  • 标题 - 数据集标题

  • 包 - 数据来源的包

  • from_cache - 是否检索到未缓存的数据

  • __doc__ - R文档的逐字内容。

注释

如果 R 数据集具有整数索引,则该索引会被重置为从零开始。否则,索引将被保留。缓存机制是简单的。也就是说,不会检查下载日期、e-tags 或其他标识信息以确定是否应再次下载数据。如果数据集在缓存中,则使用它。


Last update: Oct 16, 2024