绘制边界框¶
- torchvision.utils.draw_bounding_boxes(image: Tensor, boxes: Tensor, labels: Optional[List[str]] = None, colors: Optional[Union[List[Union[str, Tuple[int, int, int]]], str, Tuple[int, int, int]]] = None, fill: Optional[bool] = False, width: int = 1, font: Optional[str] = None, font_size: Optional[int] = None) Tensor [source]¶
在给定的RGB图像上绘制边界框。 图像值应为[0, 255]范围内的uint8或[0, 1]范围内的浮点数。 如果fill为True,结果张量应保存为PNG图像。
- Parameters:
image (Tensor) – 形状为 (C, H, W) 且数据类型为 uint8 或 float 的张量。
boxes (Tensor) – 大小为 (N, 4) 的张量,包含以 (xmin, ymin, xmax, ymax) 格式表示的边界框。请注意,这些框是相对于图像的绝对坐标。换句话说:0 <= xmin < xmax < W 和 0 <= ymin < ymax < H。
labels (List[str]) – 包含边界框标签的列表。
颜色 (颜色 或 颜色列表, 可选) – 包含盒子颜色的列表或所有盒子的单一颜色。颜色可以表示为PIL字符串,例如“红色”或“#FF00FF”,或作为RGB元组,例如
(240, 10, 157)
。默认情况下,为盒子生成随机颜色。fill (bool) – 如果 True 用指定颜色填充边界框。
width (int) – 边界框的宽度。
font (str) – 包含TrueType字体的文件名。如果在此文件名中找不到文件,加载程序可能还会在其他目录中搜索,例如Windows上的fonts/目录或macOS上的/Library/Fonts/、/System/Library/Fonts/和~/Library/Fonts/。
font_size (int) – 请求的字体大小,单位为点。
- Returns:
绘制了边界框的dtype uint8图像张量。
- Return type:
img (张量[C, H, W])
使用
draw_bounding_boxes
的示例: