skfolio.datasets.load_nasdaq_dataset#

skfolio.datasets.load_nasdaq_dataset(data_home=None, download_if_missing=True)[来源]#

从纳斯达克综合指数加载1455个资产的价格。

该数据集由1455个NASDAQ综合指数资产的每日价格组成,时间从2018年1月2日到2023年5月31日。

数据来自雅虎公共API。 价格是经过调整的收盘价,即在考虑所有适用的拆分和股息分配后的收盘价。 该调整使用适当的拆分和股息乘数,遵循证券价格研究中心(CRSP)标准。

观察

1362

资产

1455

Parameters:
data_homestr, optional

为数据集指定另一个下载和缓存文件夹。 默认情况下,所有 skfolio 数据存储在 ~/skfolio_data 子文件夹中。

download_if_missingbool, default=True

如果为 False,当数据在本地不可用时,抛出 OSError,而不是尝试从源网站下载数据。

Returns:
dfDataFrame of shape (n_observations, n_assets)

价格数据框

示例

>>> from skfolio.datasets import load_nasdaq_dataset
>>> prices = load_nasdaq_dataset()
>>> prices.head()
               AAL   AAOI    AAON    AAPL  ...  ZVRA   ZYME    ZYNE   ZYXI
Date                                       ...
2018-01-02  51.648  37.91  35.621  41.310  ...  66.4  7.933  12.995  2.922
2018-01-03  51.014  37.89  36.247  41.303  ...  72.8  7.965  13.460  2.913
2018-01-04  51.336  38.38  36.103  41.495  ...  78.4  8.430  12.700  2.869
2018-01-05  51.316  38.89  36.681  41.967  ...  77.6  8.400  12.495  2.780
2018-01-08  50.809  38.37  36.103  41.811  ...  82.4  8.310  12.550  2.825