skfolio.datasets.load_nasdaq_dataset#
- skfolio.datasets.load_nasdaq_dataset(data_home=None, download_if_missing=True)[来源]#
从纳斯达克综合指数加载1455个资产的价格。
该数据集由1455个NASDAQ综合指数资产的每日价格组成,时间从2018年1月2日到2023年5月31日。
数据来自雅虎公共API。 价格是经过调整的收盘价,即在考虑所有适用的拆分和股息分配后的收盘价。 该调整使用适当的拆分和股息乘数,遵循证券价格研究中心(CRSP)标准。
观察
1362
资产
1455
- Parameters:
- data_homestr, optional
为数据集指定另一个下载和缓存文件夹。 默认情况下,所有 skfolio 数据存储在
~/skfolio_data子文件夹中。- download_if_missingbool, default=True
如果为 False,当数据在本地不可用时,抛出 OSError,而不是尝试从源网站下载数据。
- Returns:
- dfDataFrame of shape (n_observations, n_assets)
价格数据框
示例
>>> from skfolio.datasets import load_nasdaq_dataset >>> prices = load_nasdaq_dataset() >>> prices.head() AAL AAOI AAON AAPL ... ZVRA ZYME ZYNE ZYXI Date ... 2018-01-02 51.648 37.91 35.621 41.310 ... 66.4 7.933 12.995 2.922 2018-01-03 51.014 37.89 36.247 41.303 ... 72.8 7.965 13.460 2.913 2018-01-04 51.336 38.38 36.103 41.495 ... 78.4 8.430 12.700 2.869 2018-01-05 51.316 38.89 36.681 41.967 ... 77.6 8.400 12.495 2.780 2018-01-08 50.809 38.37 36.103 41.811 ... 82.4 8.310 12.550 2.825