torch_frame.config.ImageEmbedder

class ImageEmbedder(*args, **kwargs)[来源]

基类:ABC

image_embedder 的父类,用于 ImageEmbedderConfig。该类首先根据数据框中存储的给定路径检索图像,然后将检索到的图像嵌入到张量中。用户负责实现 forward_embed(),该方法接收图像列表并返回嵌入张量。用户还可以重写 forward_retrieve(),该方法接收图像路径并返回 PIL.Image.Image 列表。

forward_retrieve(path_to_images: list[str]) list[PIL.Image.Image][source]

检索函数,从文件路径列表中读取图像列表,使用RGB模式。

abstract forward_embed(images: list[PIL.Image.Image]) Tensor[source]

嵌入函数,接收图像列表并返回嵌入张量。