快速开始¶
安装指南¶
需求¶
Python 3: DT 需要 Python 版本 3.6 或 3.7。
Tensorflow >= 2.4.0: DT 基于 TensorFlow。请按照此 教程 安装适用于 python3 的 TensorFlow。
安装DeepTables¶
pip 推荐使用 pip 安装 DeepTables:
pip install tensorflow deeptables
注意:
- DeepTables 需要 Tensorflow,请在运行 DeepTables 之前安装它。
GPU 设置(可选)
要在GPU设备上使用DeepTables,请安装tensorflow-gpu而不是tensorflow。
pip install tensorflow-gpu deeptables
验证安装:
python -c "from deeptables.utils.quicktest import test; test()"
启动一个DeepTables Docker容器¶
你也可以通过Docker快速尝试DeepTables:
- Pull a DeepTables image (optional).
- Launch Docker container.
拉取最新的镜像:
docker pull datacanvas/deeptables-example
然后使用以下命令行启动Docker容器:
docker run -it -p 8830:8888 -e NotebookToken="your-token" datacanvas/deeptables-example
值“your-token”是用户为笔记本指定的字符串,可以为空。
因此,笔记本服务器应该运行在:https://host-ip-address:8830?token=your-token
启动浏览器并连接到该URL,您将看到如下所示的Jupyter Notebook:

入门指南:5行代码实现DT¶
支持的任务¶
DT 可用于解决表格数据上的分类和回归预测问题。
简单示例¶
DT 通过极其简单的界面支持这些任务,无需处理数据清理和特征工程。您甚至不需要指定任务类型,DT 会自动推断。
from deeptables.models.deeptable import DeepTable, ModelConfig
from deeptables.models.deepnets import DeepFM
dt = DeepTable(ModelConfig(nets=DeepFM))
dt.fit(X, y)
preds = dt.predict(X_test)
数据集¶
DT 有几个内置的数据集用于演示或测试,涵盖了二分类、多分类和回归任务。所有数据集都通过 deeptables.datasets.dsutils 访问。
成人¶
关联任务:二元分类
根据人口普查数据预测收入是否超过每年5万美元。也称为“人口普查收入”数据集。
from deeptables.datasets import dsutils
df = dsutils.load_adult()
玻璃识别¶
关联任务:多类分类
来自美国法医科学服务;6种类型的玻璃;根据其氧化物含量定义(即Na、Fe、K等)
from deeptables.datasets import dsutils
df = dsutils.load_glass_uci()
参见:http://archive.ics.uci.edu/ml/datasets/Glass+Identification
波士顿房价¶
关联任务:回归
from deeptables.datasets import dsutils
df = dsutils.load_boston()
参见:https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_boston.html