TensorFlow 和 Keras 中的图像分类

介绍

图像分类是计算机视觉中的核心任务。构建更好的分类器来识别图片中的物体是一个活跃的研究领域，因为它有从交通控制系统到卫星成像的广泛应用。

这样的模型非常适合与Gradio的图像输入组件一起使用，因此在本教程中，我们将构建一个使用Gradio进行图像分类的Web演示。我们将能够在Python中构建整个Web应用程序，它将看起来像页面底部的演示。

让我们开始吧！

先决条件

确保你已经安装了gradio Python包。我们将使用一个预训练的Keras图像分类模型，因此你也应该安装tensorflow。

步骤1 — 设置图像分类模型

首先，我们需要一个图像分类模型。在本教程中，我们将使用预训练的Mobile Net模型，因为它可以轻松从Keras下载。你可以使用不同的预训练模型或训练自己的模型。

import tensorflow as tf

inception_net = tf.keras.applications.MobileNetV2()

这一行使用Keras库自动下载MobileNet模型和权重。

步骤 2 — 定义一个 `predict` 函数

接下来，我们需要定义一个函数，该函数接收用户输入，在这种情况下是一张图片，并返回预测结果。预测结果应作为字典返回，其键为类名，值为置信概率。我们将从这个文本文件中加载类名。

在我们的预训练模型的情况下，它看起来像这样：

import requests

# Download human-readable labels for ImageNet.
response = requests.get("https://git.io/JJkYN")
labels = response.text.split("\n")

def classify_image(inp):
  inp = inp.reshape((-1, 224, 224, 3))
  inp = tf.keras.applications.mobilenet_v2.preprocess_input(inp)
  prediction = inception_net.predict(inp).flatten()
  confidences = {labels[i]: float(prediction[i]) for i in range(1000)}
  return confidences

让我们分解一下。该函数接受一个参数：

inp: 输入图像作为 numpy 数组

然后，函数添加一个批次维度，通过模型传递它，并返回：

confidences: 预测结果，作为一个字典，其键是类别标签，值是置信概率

步骤 3 — 创建 Gradio 界面

现在我们已经设置好了预测函数，我们可以围绕它创建一个Gradio界面。

在这种情况下，输入组件是一个拖放图像组件。要创建此输入，我们可以使用"gradio.inputs.Image"类，该类创建组件并处理预处理以将其转换为numpy数组。我们将使用一个参数实例化该类，该参数自动将输入图像预处理为224像素乘224像素，这是MobileNet期望的大小。

输出组件将是一个"label"，它以美观的形式显示顶部标签。由于我们不想显示所有1,000个类别标签，我们将自定义它只显示前3张图片。

最后，我们将再添加一个参数，examples，它允许我们用一些预定义的示例预填充我们的接口。Gradio 的代码如下所示：

import gradio as gr

gr.Interface(fn=classify_image,
             inputs=gr.Image(width=224, height=224),
             outputs=gr.Label(num_top_classes=3),
             examples=["banana.jpg", "car.jpg"]).launch()

这将生成以下界面，您可以直接在浏览器中尝试（尝试上传您自己的示例！）：

你已经完成了！这就是你构建图像分类器网络演示所需的所有代码。如果你想与他人分享，尝试在launch()接口时设置share=True！

TensorFlow 和 Keras 中的图像分类

介绍

先决条件

步骤1 — 设置图像分类模型

步骤 2 — 定义一个 predict 函数

步骤 3 — 创建 Gradio 界面

步骤 2 — 定义一个 `predict` 函数