流式输出

在某些情况下，您可能希望流式传输一系列输出，而不是一次性显示单个输出。例如，您可能有一个图像生成模型，并且您希望显示每一步生成的图像，直到最终图像。或者您可能有一个聊天机器人，它一次流式传输一个令牌的响应，而不是一次性返回所有响应。

在这种情况下，你可以向Gradio提供一个生成器函数，而不是一个常规函数。在Python中创建生成器非常简单：函数不是返回一个单一的值，而是应该yield一系列的值。通常yield语句放在某种循环中。这里有一个简单的生成器示例，它只是计数到一个给定的数字：

def my_generator(x):
    for i in range(x):
        yield i

您可以将生成器提供给Gradio，就像您提供常规函数一样。例如，这里有一个（假的）图像生成模型，它在使用gr.Interface类输出图像之前生成几步噪声：

import gradio as gr
import numpy as np
import time

def fake_diffusion(steps):
    rng = np.random.default_rng()
    for i in range(steps):
        time.sleep(1)
        image = rng.random(size=(600, 600, 3))
        yield image
    image = np.ones((1000,1000,3), np.uint8)
    image[:] = [255, 124, 0]
    yield image

demo = gr.Interface(fake_diffusion,
                    inputs=gr.Slider(1, 10, 3, step=1),
                    outputs="image")

demo.launch()

请注意，我们在迭代器中添加了一个time.sleep(1)，以在步骤之间创建一个人为的暂停，以便您能够观察迭代器的步骤（在真实的图像生成模型中，这可能是不必要的）。

同样地，Gradio 可以处理流式输入，例如一个图像生成模型，每当用户在文本框中输入一个字母时就会重新运行。这在我们关于构建响应式界面的指南中有更详细的介绍。

流媒体

Gradio 可以直接从您的生成器函数中流式传输音频和视频。这让您的用户几乎在函数yielded音频或视频的同时就能听到或看到。您只需要

在你的gr.Audio或gr.Video输出组件中设置streaming=True。
编写一个Python生成器，生成下一个音频或视频的“块”。
设置 autoplay=True 以便媒体自动开始播放。

对于音频，下一个“块”可以是.mp3或.wav文件，也可以是音频的bytes序列。对于视频，下一个“块”必须是.mp4文件或带有h.264编解码器且扩展名为.ts的文件。为了流畅播放，请确保块的长度一致且大于1秒。

我们将以一些简单的例子来结束，这些例子将说明这些要点。

流媒体音频

import gradio as gr
from time import sleep

def keep_repeating(audio_file):
    for _ in range(10):
        sleep(0.5)
        yield audio_file

gr.Interface(keep_repeating,
             gr.Audio(sources=["microphone"], type="filepath"),
             gr.Audio(streaming=True, autoplay=True)
).launch()

流媒体视频

import gradio as gr
from time import sleep

def keep_repeating(video_file):
    for _ in range(10):
        sleep(0.5)
        yield video_file

gr.Interface(keep_repeating,
             gr.Video(sources=["webcam"], format="mp4"),
             gr.Video(streaming=True, autoplay=True)
).launch()

端到端示例

有关流媒体的端到端示例，请参阅视频中的对象检测指南或使用transformers生成流式AI音频的指南。