torch_frame.data

数据对象

TensorFrame

一个张量框架为每个表格列持有一个张量。

MultiEmbeddingTensor

一个只读的基于PyTorch张量的数据结构,存储[num_rows, num_cols, *],其中最后一维的大小可以因列而异。

MultiNestedTensor

一个只读的基于PyTorch张量的数据结构,存储[num_rows, num_cols, *],其中最后一维的大小对于不同的行/列可以不同。

Dataset

用于创建表格数据集的基类。

统计

StatType

列统计的不同类型。

数据加载器

DataLoader

一个数据加载器,它从torch_frame.Datasettorch_frame.TensorFrame对象创建小批量数据。

辅助函数

download_url

url的内容下载到指定的文件夹root

DataFrameToTensorFrameConverter

一个将数据框转换为TensorFrame的转换器。