绘制边界框¶

torchvision.utils.draw_bounding_boxes(image: Tensor, boxes: Tensor, labels: Optional[List[str]] = None, colors: Optional[Union[List[Union[str, Tuple[int, int, int]]], str, Tuple[int, int, int]]] = None, fill: Optional[bool] = False, width: int = 1, font: Optional[str] = None, font_size: Optional[int] = None) → Tensor[source]¶

在给定的RGB图像上绘制边界框。图像值应为[0, 255]范围内的uint8或[0, 1]范围内的浮点数。如果fill为True，结果张量应保存为PNG图像。

Parameters:

image (Tensor) – 形状为 (C, H, W) 且数据类型为 uint8 或 float 的张量。
boxes (Tensor) – 大小为 (N, 4) 的张量，包含以 (xmin, ymin, xmax, ymax) 格式表示的边界框。请注意，这些框是相对于图像的绝对坐标。换句话说：0 <= xmin < xmax < W 和 0 <= ymin < ymax < H。
labels (List[str]) – 包含边界框标签的列表。
颜色 (颜色或 颜色列表, 可选) – 包含盒子颜色的列表或所有盒子的单一颜色。颜色可以表示为PIL字符串，例如“红色”或“#FF00FF”，或作为RGB元组，例如(240, 10, 157)。默认情况下，为盒子生成随机颜色。
fill (bool) – 如果 True 用指定颜色填充边界框。
width (int) – 边界框的宽度。
font (str) – 包含TrueType字体的文件名。如果在此文件名中找不到文件，加载程序可能还会在其他目录中搜索，例如Windows上的fonts/目录或macOS上的/Library/Fonts/、/System/Library/Fonts/和~/Library/Fonts/。
font_size (int) – 请求的字体大小，单位为点。

Returns:

绘制了边界框的dtype uint8图像张量。

Return type:

img (张量[C, H, W])

使用 draw_bounding_boxes 的示例：

Repurposing masks into bounding boxes

Visualization utilities