pyspark.sql.functions.schema_of_json ¶
-
pyspark.sql.functions.schema_of_json( json : ColumnOrName , options : Optional [ Dict [ str , str ] ] = None ) → pyspark.sql.column.Column [source] ¶ -
解析JSON字符串并推断其DDL格式的模式。
新增于版本 2.4.0。
在版本 3.4.0 中更改: 支持 Spark Connect。
- Parameters
- Returns
-
-
列 -
从给定JSON解析的
StructType的字符串表示。
-
示例
>>> df = spark.range(1) >>> df.select(schema_of_json(lit('{"a": 0}')).alias("json")).collect() [Row(json='STRUCT<a: BIGINT>')] >>> schema = schema_of_json('{a: 1}', {'allowUnquotedFieldNames':'true'}) >>> df.select(schema.alias("json")).collect() [Row(json='STRUCT<a: BIGINT>')]