Shortcuts

边界框

class torchvision.tv_tensors.BoundingBoxes(data: Any, *, format: Union[BoundingBoxFormat, str], canvas_size: Tuple[int, int], dtype: Optional[dtype] = None, device: Optional[Union[device, str, int]] = None, requires_grad: Optional[bool] = None)[source]

torch.Tensor 子类,用于表示形状为 [N, 4] 的边界框。

注意

每个样本应该只有一个BoundingBoxes实例,例如{"img": img, "bbox": BoundingBoxes(...)},尽管一个BoundingBoxes对象可以包含多个边界框。

Parameters:
  • data – 任何可以通过torch.as_tensor()转换为张量的数据。

  • format (BoundingBoxFormat, str) – 边界框的格式。

  • canvas_size (两个python:ints的元组) – 对应图像或视频的高度和宽度。

  • dtype (torch.dpython:type, optional) – 边界框的期望数据类型。如果省略,将从 data中推断。

  • device (torch.device, 可选) – 边界框的目标设备。如果省略且 datatorch.Tensor,则设备取自该张量。否则,边界框将在 CPU 上构建。

  • requires_grad (bool, 可选) – 是否应记录边界框上的自动梯度操作。如果省略且 datatorch.Tensor,则从其取值。否则,默认为 False

使用BoundingBoxes的示例:

开始使用 transforms v2

Getting started with transforms v2

如何编写自己的v2转换

How to write your own v2 transforms

TVTensors 常见问题

TVTensors FAQ

如何编写你自己的TVTensor类

How to write your own TVTensor class