autogen_ext.agents.video_surfer.tools#

extract_audio(video_path: str, audio_output_path: str) str[源代码]#

从视频文件中提取音频并保存为MP3文件。

Parameters:
  • video_path - 视频文件的路径。

  • audio_output_path – 保存提取的音频文件的路径。

Returns:

确认消息,包含保存的音频文件路径。

get_screenshot_at(video_path: str, timestamps: 列表[float]) 列表[元组[float, ndarray[任何, 任何]]][源代码]#

在指定的时间戳捕获屏幕截图并将其作为Python对象返回。

Parameters:
  • video_path – 视频文件的路径。

  • timestamps – 时间戳列表,单位为秒。

Returns:

包含时间戳和相应帧(图像)的元组列表。每个帧是一个NumPy数组(高度 x 宽度 x 通道)。

get_video_length(video_path: str) str[源代码]#

返回视频的长度,单位为秒。

Parameters:

video_path – 视频文件的路径。

Returns:

视频的持续时间,以秒为单位。

save_screenshot(video_path: str, timestamp: float, output_path: str) [源代码]#

在指定的时间戳捕获屏幕截图并将其保存到输出路径。

Parameters:
  • video_path - 视频文件的路径。

  • timestamp – 以秒为单位的时间戳。

  • output_path – 保存截图的路径。文件格式由路径中的扩展名决定。

transcribe_audio_with_timestamps(audio_path: str) str[源代码]#

使用Whisper模型为音频文件添加时间戳进行转录。

Parameters:

audio_path – 音频文件的路径。

Returns:

带有时间戳的转录。

async transcribe_video_screenshot(video_path: str, timestamp: float, model_client: ChatCompletionClient) str[源代码]#

使用OpenAI API转录在指定时间戳截取的视频截图内容。

Parameters:
  • video_path – 视频文件的路径。

  • timestamp – 以秒为单位的时间戳。

  • model_client – ChatCompletionClient 实例。

Returns:

截图内容的描述。