Shortcuts

随机IoU裁剪

class torchvision.transforms.v2.RandomIoUCrop(min_scale: float = 0.3, max_scale: float = 1.0, min_aspect_ratio: float = 0.5, max_aspect_ratio: float = 2.0, sampler_options: Optional[List[float]] = None, trials: int = 40)[source]

随机IoU裁剪变换来自 “SSD: Single Shot MultiBox Detector”

此转换需要输入图像或视频数据以及tv_tensors.BoundingBoxes

警告

为了正确移除IoU阈值以下的边界框,RandomIoUCrop必须紧接着SanitizeBoundingBoxes,无论是在变换管道中立即执行还是稍后执行。

如果输入是torch.TensorTVTensor(例如Image视频BoundingBoxes等), 它可以有任意数量的前导批次维度。例如, 图像可以有[..., C, H, W]形状。边界框可以有[..., 4]形状。

Parameters:
  • min_scale (float, 可选) – 缩放输入大小的最小因子。

  • max_scale (float, optional) – 缩放输入大小的最大因子。

  • min_aspect_ratio (float, optional) – 裁剪后的图像或视频的最小宽高比。

  • max_aspect_ratio (float, optional) – 裁剪后的图像或视频的最大宽高比。

  • sampler_options (list of python:float, optional) – 所有框与裁剪图像或视频之间的最小IoU(Jaccard)重叠列表。默认值为None,对应于[0.0, 0.1, 0.3, 0.5, 0.7, 0.9, 1.0]

  • trials (int, optional) – 为给定的最小IoU(Jaccard)重叠值寻找裁剪的试验次数。 默认值为40。

使用 RandomIoUCrop 的示例:

Transforms v2: 端到端目标检测/分割示例

Transforms v2: End-to-end object detection/segmentation example