随机IoU裁剪¶

class torchvision.transforms.v2.RandomIoUCrop(min_scale: float = 0.3, max_scale: float = 1.0, min_aspect_ratio: float = 0.5, max_aspect_ratio: float = 2.0, sampler_options: Optional[List[float]] = None, trials: int = 40)[source]¶

随机IoU裁剪变换来自 “SSD: Single Shot MultiBox Detector”。

此转换需要输入图像或视频数据以及tv_tensors.BoundingBoxes。

警告

为了正确移除IoU阈值以下的边界框，RandomIoUCrop必须紧接着SanitizeBoundingBoxes，无论是在变换管道中立即执行还是稍后执行。

如果输入是torch.Tensor或TVTensor（例如Image， 视频，BoundingBoxes等），它可以有任意数量的前导批次维度。例如，图像可以有[..., C, H, W]形状。边界框可以有[..., 4]形状。

Parameters:

min_scale (float, 可选) – 缩放输入大小的最小因子。
max_scale (float, optional) – 缩放输入大小的最大因子。
min_aspect_ratio (float, optional) – 裁剪后的图像或视频的最小宽高比。
max_aspect_ratio (float, optional) – 裁剪后的图像或视频的最大宽高比。
sampler_options (list of python:float, optional) – 所有框与裁剪图像或视频之间的最小IoU（Jaccard）重叠列表。默认值为None，对应于[0.0, 0.1, 0.3, 0.5, 0.7, 0.9, 1.0]
trials (int, optional) – 为给定的最小IoU（Jaccard）重叠值寻找裁剪的试验次数。默认值为40。

使用 RandomIoUCrop 的示例：

Transforms v2: 端到端目标检测/分割示例

Transforms v2: End-to-end object detection/segmentation example