torch_frame.datasets.Yandex

class Yandex(root: str, name: str)[source]

基础类:Dataset

Yandex数据集集合被“重新审视深度学习模型用于表格数据”使用。 最初从github.com/yandex-research/tabular-dl-revisiting-models下载。

统计:

名称

#行数

#cols(数值)

#cols(分类)

#classes

任务

缺失值比例

成年人

48,842

6

8

2

二元分类

0.0%

aloi

108,000

128

0

1,000

多类分类

0.0%

covtype

581,012

54

0

7

多类分类

0.0%

海伦娜

65,196

27

0

100

多类分类

0.0%

higgs_small

98,050

28

0

2

二元分类

0.0%

jannis

83,733

54

0

4

多类分类

0.0%

加州住房

20,640

8

0

1

回归

0.0%

微软

1,200,192

136

0

1

回归

0.0%

雅虎

709,877

699

0

1

回归

0.0%

年份

515,345

90

0

1

回归

0.0%