ot.datasets

简单示例数据集

函数

ot.datasets.make_1D_gauss(n, m, s)[源]

返回一个一维直方图用于高斯分布(n 个箱,均值 m 和标准差 s

Parameters:
  • n (int) – 直方图中的箱子数量

  • m (float) – 高斯分布的均值

  • s (float) – 高斯分布的标准差

Returns:

h – 高斯分布的1D直方图

Return type:

ndarray (n,)

使用 ot.datasets.make_1D_gauss 的示例

一维分布的最优传输

一维分布的最优传输

平滑和稀疏OT示例

平滑与稀疏OT示例

使用通用求解器的正则化OT

带通用求解器的正则化OT

一维中的OT距离

一维OT距离

最优传输求解器比较

最优传输求解器比较

使用 PyTorch 的 Wasserstein 1D(流和重心)

使用PyTorch的Wasserstein 1D(流动和重心)

一维 Wasserstein 重心演示

1D Wasserstein 重心演示

去偏倚的Sinkhorn重心演示

去偏差的Sinkhorn重心演示

1D 沃瑟斯坦重心:精确线性规划与熵正则化

1D Wasserstein 重心:精确线性规划与熵正则化

筛选的最优传输(Screenkhorn)

筛选的最优传输 (Screenkhorn)

低秩Sinkhorn

低秩Sinkhorn

通过d-MMOT计算d维的重心

通过d-MMOT计算d维重心

一维不平衡最优运输

一维不平衡最优运输

不平衡分布的1D Wasserstein重心演示

不平衡分布的1D Wasserstein 重心演示
ot.datasets.make_2D_samples_gauss(n, m, sigma, random_state=None)[源]

返回 n 个从二维高斯 \(\mathcal{N}(m, \sigma)\) 中提取的样本

Parameters:
  • n (int) – 要生成的样本数量

  • m (ndarray, shape (2,)) – 高斯分布的均值

  • sigma (ndarray, shape (2, 2)) – 高斯分布的协方差矩阵

  • random_state (int, RandomState 实例, 可选 (默认=None)) – 如果是整数,random_state 是随机数生成器使用的种子; 如果是 RandomState 实例,random_state 是随机数生成器; 如果是无,随机数生成器是由 np.random 使用的 RandomState 实例。

Returns:

X – 从 \(\mathcal{N}(m, \sigma)\) 中抽取的 n 个样本。

Return type:

ndarray,形状 (n, 2)

使用 ot.datasets.make_2D_samples_gauss 的示例

二维经验分布之间的最优传输

二维经验分布之间的最优传输

格罗莫夫-瓦瑟斯坦例子

Gromov-Wasserstein 示例

弱最优传输与精确最优传输

弱最优传输与精确最优传输

二维分布上的切片瓦瑟斯坦距离

二维分布上的切片瓦萨斯坦距离

不平衡最优运输的平移不变Sinkhorn

不平衡最优运输的平移不变Sinkhorn

二维准确和熵不平衡最优传输的示例

精确和熵不平衡最优运输的二维示例

部分Wasserstein和Gromov-Wasserstein示例

部分沃瑟斯坦和格罗莫夫-沃瑟斯坦示例

l2-惩罚不平衡最优传输的正则化路径

l2惩罚不平衡最优运输的正则化路径
ot.datasets.make_data_classif(dataset, n, nz=0.5, theta=0, p=0.5, random_state=None, **kwargs)[源]

用于分类问题的数据集生成

Parameters:
  • dataset (str) – 分类问题的类型(见代码)

  • n (int) – 训练样本的数量

  • nz (float) – 噪声水平 (>0)

  • p (float) – 二元设置中某一类的比例

  • random_state (int, RandomState 实例, 可选 (默认=None)) – 如果是整数,random_state 是随机数生成器使用的种子; 如果是 RandomState 实例,random_state 是随机数生成器; 如果是无,随机数生成器是由 np.random 使用的 RandomState 实例。

Returns:

  • X (ndarray, shape (n, d)) – n 个大小为 d 的观察值

  • y (ndarray, shape (n,)) – 样本的标签。

使用 ot.datasets.make_data_classif 的示例

用于熵和二次正则OT的双重OT求解器,使用Pytorch

使用Pytorch的熵型和二次正则化的双重OT求解器

用于领域适应的拉普拉斯正则化的OT

用于领域适应的拉普拉斯正则化的OT

领域适应的OT映射估计

用于领域适应的OT映射估计

OTDA 无监督与半监督设置

OTDA 无监督与半监督设置

用于领域适应的OT

用于领域适应的OT

用于经验分布域适应的OT

用于经验分布的领域适应的 OT

多源目标转移的OT

多源目标偏移的OT
ot.datasets.make_1D_gauss(n, m, s)[源]

返回一个一维直方图用于高斯分布(n 个箱,均值 m 和标准差 s

Parameters:
  • n (int) – 直方图中的箱子数量

  • m (float) – 高斯分布的均值

  • s (float) – 高斯分布的标准差

Returns:

h – 高斯分布的1D直方图

Return type:

ndarray (n,)

ot.datasets.make_2D_samples_gauss(n, m, sigma, random_state=None)[源]

返回 n 个从二维高斯 \(\mathcal{N}(m, \sigma)\) 中提取的样本

Parameters:
  • n (int) – 要生成的样本数量

  • m (ndarray, shape (2,)) – 高斯分布的均值

  • sigma (ndarray, shape (2, 2)) – 高斯分布的协方差矩阵

  • random_state (int, RandomState 实例, 可选 (默认=None)) – 如果是整数,random_state 是随机数生成器使用的种子; 如果是 RandomState 实例,random_state 是随机数生成器; 如果是无,随机数生成器是由 np.random 使用的 RandomState 实例。

Returns:

X – 从 \(\mathcal{N}(m, \sigma)\) 中抽取的 n 个样本。

Return type:

ndarray,形状 (n, 2)

ot.datasets.make_data_classif(dataset, n, nz=0.5, theta=0, p=0.5, random_state=None, **kwargs)[源]

用于分类问题的数据集生成

Parameters:
  • dataset (str) – 分类问题的类型(见代码)

  • n (int) – 训练样本的数量

  • nz (float) – 噪声水平 (>0)

  • p (float) – 二元设置中某一类的比例

  • random_state (int, RandomState 实例, 可选 (默认=None)) – 如果是整数,random_state 是随机数生成器使用的种子; 如果是 RandomState 实例,random_state 是随机数生成器; 如果是无,随机数生成器是由 np.random 使用的 RandomState 实例。

Returns:

  • X (ndarray, shape (n, d)) – n 个大小为 d 的观察值

  • y (ndarray, shape (n,)) – 样本的标签。