Table of Contents

Shortcuts

边界框¶

class torchvision.tv_tensors.BoundingBoxes(data: Any, *, format: Union[BoundingBoxFormat, str], canvas_size: Tuple[int, int], dtype: Optional[dtype] = None, device: Optional[Union[device, str, int]] = None, requires_grad: Optional[bool] = None)[source]¶

torch.Tensor 子类，用于表示形状为 [N, 4] 的边界框。

注意

每个样本应该只有一个BoundingBoxes实例，例如{"img": img, "bbox": BoundingBoxes(...)}，尽管一个BoundingBoxes对象可以包含多个边界框。

Parameters:

data – 任何可以通过torch.as_tensor()转换为张量的数据。
format (BoundingBoxFormat, str) – 边界框的格式。
canvas_size (两个python:ints的元组) – 对应图像或视频的高度和宽度。
dtype (torch.dpython:type, optional) – 边界框的期望数据类型。如果省略，将从 data中推断。
device (torch.device, 可选) – 边界框的目标设备。如果省略且 data 是 torch.Tensor，则设备取自该张量。否则，边界框将在 CPU 上构建。
requires_grad (bool, 可选) – 是否应记录边界框上的自动梯度操作。如果省略且 data 是 torch.Tensor，则从其取值。否则，默认为 False。

使用BoundingBoxes的示例：

开始使用 transforms v2

Getting started with transforms v2

如何编写自己的v2转换

How to write your own v2 transforms

TVTensors 常见问题

TVTensors FAQ

如何编写你自己的TVTensor类

How to write your own TVTensor class