torch_frame.config.ImageEmbedderConfig

class ImageEmbedderConfig(image_embedder: Callable[[list[str]], Tensor], batch_size: int | None = None)[source]

基础类:object

图像嵌入模型,将图像列表映射为PyTorch张量嵌入。

Parameters:
  • image_embedder (可调用) – 一个可调用的图像嵌入器,它接收一个图像路径列表作为输入,并输出该图像列表的PyTorch张量嵌入。通常它包含一个用于加载图像文件的检索器,然后是一个将图像转换为嵌入的嵌入器。

  • batch_size (int, optional) – 编码图像时使用的批量大小。如果设置为 None,图像嵌入将以全批量的方式获取。(默认值:None