kedro.io.MemoryDataset¶
- class kedro.io.MemoryDataset(data=<object object>, copy_mode=None, metadata=None)[source]¶
MemoryDataset从内存中的Python对象加载数据并保存数据。设置_EPHEMERAL属性为True以表明MemoryDataset的非持久性。示例:
from kedro.io import MemoryDataset import pandas as pd data = pd.DataFrame({'col1': [1, 2], 'col2': [4, 5], 'col3': [5, 6]}) dataset = MemoryDataset(data=data) loaded_data = dataset.load() assert loaded_data.equals(data) new_data = pd.DataFrame({'col1': [1, 2], 'col2': [4, 5]}) dataset.save(new_data) reloaded_data = dataset.load() assert reloaded_data.equals(new_data)
方法
exists()通过调用提供的_exists()方法检查数据集输出是否已存在。
from_config(name, config[, load_version, ...])使用提供的配置创建一个数据集实例。
load()通过委托提供的加载方法来加载数据。
release()释放所有缓存数据。
save(data)通过委托给提供的保存方法来保存数据。
将数据集实例转换为基于字典的配置以便序列化。
- __init__(data=<object object>, copy_mode=None, metadata=None)[source]¶
创建一个新的
MemoryDataset实例,指向提供的Python对象。
- exists()[source]¶
通过调用提供的_exists()方法检查数据集输出是否已存在。
- Return type:
- Returns:
标志,指示输出是否已存在。
- Raises:
DatasetError – 当底层exists方法引发错误时。
- classmethod from_config(name, config, load_version=None, save_version=None)[source]¶
使用提供的配置创建一个数据集实例。
- Parameters:
- Return type:
- Returns:
AbstractDataset子类的一个实例。- Raises:
DatasetError – 当函数无法从其配置创建数据集时。
- load()[source]¶
通过委托提供的加载方法来加载数据。
- Return type:
- Returns:
由提供的加载方法返回的数据。
- Raises:
DatasetError – 当底层加载方法引发错误时。
- release()[source]¶
释放所有缓存数据。
- Raises:
DatasetError – 当底层释放方法引发错误时。
- Return type:
- save(data)[source]¶
通过委托给提供的保存方法来保存数据。
- Parameters:
data (
Any) – 需要通过提供的保存方法保存的值。- Raises:
DatasetError – 当底层保存方法引发错误时。
FileNotFoundError – 当保存方法在Windows系统上获取到的是文件而非目录时抛出该错误。
NotADirectoryError – 当保存方法在Unix系统上获取到文件而非目录时抛出。
- Return type: