TokenPositionalEmbedding¶
- class torchtune.models.clip.TokenPositionalEmbedding(embed_dim: int, tile_size: int, patch_size: int)[source]¶
图像的令牌位置嵌入,对于图像中的每个令牌都是不同的。
请注意,tile 与 patch(token)不同。详情请查看
torchtune.modules.vision_transformer.VisionTransformer的文档。- Parameters: