输入
音频输入
dataclass
用作VoicePipeline输入的静态音频。
Source code in src/agents/voice/input.py
缓冲区
instance-attribute
一个包含代理音频数据的缓冲区。必须是一个int16或float32类型的numpy数组。
to_audio_file
to_base64
返回音频数据的base64编码字符串。
Source code in src/agents/voice/input.py
流式音频输入
音频输入表示为音频数据流。您可以将其传递给VoicePipeline,然后使用add_audio方法将音频数据推入队列。
Source code in src/agents/voice/input.py
add_audio
async
向流中添加更多音频数据。
参数:
| 名称 | 类型 | 描述 | 默认值 |
|---|---|---|---|
audio
|
NDArray[int16 | float32]
|
要添加的音频数据。必须是一个int16或float32类型的numpy数组。 |
required |