pandera.api.pyspark.model_config.BaseConfig

class pandera.api.pyspark.model_config.BaseConfig[source]

基类: BaseModelConfig

定义 DataFrameSchema 范围的选项。

0.16.0版本新增

属性

coerce

强制所有架构组件的类型

description

任意文本描述

dtype

数据框的datatype。

from_format

验证前的数据格式。

from_format_kwargs

一个字典关键字参数,用于传递给将from_format类型的对象转换为可验证的pandera数据结构的读取函数。

metadata

一个字典对象,用于在模式层级存储键值数据

name

模式的名称

ordered

验证列的顺序

strict

确保所有指定的列都在经过验证的数据框中 - 如果 "filter",则移除未在架构中指定的列

title

模式的可读标签

to_format

验证后要序列化的数据格式。

to_format_buffer

当 to_format 是自定义可调用时提供的缓冲区。

to_format_kwargs

一个字典关键字参数,用于传递给将 pandera 可验证对象转换为类型 to_format 的写入函数。

unique

确保某些列组合是唯一的

unique_column_names

确保数据框的列名称是唯一的