快速开始

安装指南

需求

Python 3: DT 需要 Python 版本 3.6 或 3.7。

Tensorflow >= 2.4.0: DT 基于 TensorFlow。请按照此 教程 安装适用于 python3 的 TensorFlow。

安装DeepTables

pip 推荐使用 pip 安装 DeepTables:

pip install tensorflow deeptables

注意:

  • DeepTables 需要 Tensorflow,请在运行 DeepTables 之前安装它。

GPU 设置(可选)

要在GPU设备上使用DeepTables,请安装tensorflow-gpu而不是tensorflow

pip install tensorflow-gpu deeptables

验证安装:

python -c "from deeptables.utils.quicktest import test; test()"

启动一个DeepTables Docker容器

你也可以通过Docker快速尝试DeepTables:

  1. Pull a DeepTables image (optional).
  2. Launch Docker container.

拉取最新的镜像:

docker pull datacanvas/deeptables-example

然后使用以下命令行启动Docker容器:

docker run -it -p 8830:8888 -e NotebookToken="your-token"  datacanvas/deeptables-example

值“your-token”是用户为笔记本指定的字符串,可以为空。

因此,笔记本服务器应该运行在:https://host-ip-address:8830?token=your-token 启动浏览器并连接到该URL,您将看到如下所示的Jupyter Notebook: _images/notebook_home.png

入门指南:5行代码实现DT

支持的任务

DT 可用于解决表格数据上的分类回归预测问题。

简单示例

DT 通过极其简单的界面支持这些任务,无需处理数据清理和特征工程。您甚至不需要指定任务类型,DT 会自动推断。

from deeptables.models.deeptable import DeepTable, ModelConfig
from deeptables.models.deepnets import DeepFM

dt = DeepTable(ModelConfig(nets=DeepFM))
dt.fit(X, y)
preds = dt.predict(X_test)

数据集

DT 有几个内置的数据集用于演示或测试,涵盖了二分类、多分类和回归任务。所有数据集都通过 deeptables.datasets.dsutils 访问。

成人

关联任务:二元分类

根据人口普查数据预测收入是否超过每年5万美元。也称为“人口普查收入”数据集。

from deeptables.datasets import dsutils
df = dsutils.load_adult()

参见:http://archive.ics.uci.edu/ml/datasets/Adult

玻璃识别

关联任务:多类分类

来自美国法医科学服务;6种类型的玻璃;根据其氧化物含量定义(即Na、Fe、K等)

from deeptables.datasets import dsutils
df = dsutils.load_glass_uci()

参见:http://archive.ics.uci.edu/ml/datasets/Glass+Identification

波士顿房价

关联任务:回归

from deeptables.datasets import dsutils
df = dsutils.load_boston()

参见:https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_boston.html

示例

参见:Examples