torch_frame

列的语义类型。

语义类型表示列的含义,并指示在表格深度学习模型中如何将列编码到嵌入空间中:

import torch_frame

stype = torch_frame.numerical  # Numerical columns
stype = torch_frame.categorical  # Categorical columns
...
numerical

数值列。

categorical

分类列。

text_embedded

预计算的文本列嵌入。

text_tokenized

用于微调的标记化文本列。

multicategorical

多类别列。

sequence_numerical

数值序列。

embedding

嵌入列。

timestamp

时间戳列。

image_embedded

图像列的预计算嵌入。

class Metric(value)[source]

指标。

ACCURACY

准确率

ROCAUC

rocauc

RMSE

均方根误差

MAE

mae

class TaskType(value)[source]

任务的类型。

REGRESSION

回归任务。

MULTICLASS_CLASSIFICATION

多类分类任务。

BINARY_CLASSIFICATION

二元分类任务。

class NAStrategy(value)[source]

处理列中NaN值的策略。

MEAN

torch_frame.numerical列的平均值替换NaN值。

ZEROS

torch_frame.numerical列中的NaN值替换为零。

MOST_FREQUENT

用最频繁的类别替换torch_frame.categorical列中的NaN值。