pandera.api.dataframe.model.DataFrameModel¶
- class pandera.api.dataframe.model.DataFrameModel(*args, **kwargs)[source]¶
数据框模型的基类。
请参阅 用户指南 以获取更多信息。
根据模式规范验证数据框。
- Parameters:
check_obj (pd.DataFrame) – 要验证的数据框。
head – 验证前n行。与 tail 或 sample 重叠的行会被去重。
tail – 验证最后 n 行。与 head 或 sample 重叠的行会被去重。
sample – 验证 n 行的随机样本。与 head 或 tail 重叠的行将被去重。
random_state –
sample参数的随机种子。lazy – 如果为 True,则懒惰地对数据框进行所有验证检查,并引发一个
SchemaErrors。否则,一旦发生错误,立即引发SchemaError。inplace – 如果为True,应用强制转换到验证对象, 否则创建数据的副本。
- Returns:
验证过的
DataFrame- Raises:
SchemaError – 当
DataFrame违反内置或自定义检查时。
方法
- classmethod example(cls, **kwargs)[source]¶
生成特定大小的示例。
- Parameters:
size – 生成的 DataFrame 中的元素数量。
- Return type:
DataFrameBase[~TDataFrameModel]- Returns:
数据框对象。
- classmethod strategy(cls, **kwargs)[source]¶
创建一个
hypothesis策略来生成一个 DataFrame。- Parameters:
size – 生成的元素数量
n_regex_columns – 生成的正则表达式列的数量。
- Returns:
生成 DataFrame 对象的策略。
- classmethod to_schema()[source]¶
从
DataFrameModel创建DataFrameSchema。- Return type:
~TSchema
- classmethod validate(check_obj, head=None, tail=None, sample=None, random_state=None, lazy=False, inplace=False)[source]¶
根据模式规范验证数据框。
- Parameters:
- Return type:
DataFrameBase[~TDataFrameModel]- Returns:
验证过的
DataFrame- Raises:
SchemaError – 当
DataFrame违反内置或自定义检查时。