pandera.api.pyspark.model_config.BaseConfig¶
- class pandera.api.pyspark.model_config.BaseConfig[source]¶
基类:
BaseModelConfig定义 DataFrameSchema 范围的选项。
0.16.0版本新增
属性
coerce强制所有架构组件的类型
description任意文本描述
dtype数据框的datatype。
from_format验证前的数据格式。
from_format_kwargs一个字典关键字参数,用于传递给将
from_format类型的对象转换为可验证的pandera数据结构的读取函数。metadata一个字典对象,用于在模式层级存储键值数据
name模式的名称
ordered验证列的顺序
strict确保所有指定的列都在经过验证的数据框中 - 如果
"filter",则移除未在架构中指定的列title模式的可读标签
to_format验证后要序列化的数据格式。
to_format_buffer当 to_format 是自定义可调用时提供的缓冲区。
to_format_kwargs一个字典关键字参数,用于传递给将 pandera 可验证对象转换为类型
to_format的写入函数。unique确保某些列组合是唯一的
unique_column_names确保数据框的列名称是唯一的