ot.datasets

简单示例数据集

函数

ot.datasets.make_1D_gauss(n, m, s)[源]

返回一个一维直方图用于高斯分布（n 个箱，均值 m 和标准差 s）

Parameters:

n (int) – 直方图中的箱子数量
m (float) – 高斯分布的均值
s (float) – 高斯分布的标准差

Returns:

h – 高斯分布的1D直方图

Return type:

ndarray (n,)

使用 `ot.datasets.make_1D_gauss` 的示例

平滑与稀疏OT示例

带通用求解器的正则化OT

一维OT距离

使用 PyTorch 的 Wasserstein 1D（流和重心）

使用PyTorch的Wasserstein 1D（流动和重心）

一维 Wasserstein 重心演示

1D Wasserstein 重心演示

去偏倚的Sinkhorn重心演示

去偏差的Sinkhorn重心演示

1D 沃瑟斯坦重心：精确线性规划与熵正则化

1D Wasserstein 重心：精确线性规划与熵正则化

筛选的最优传输（Screenkhorn）

筛选的最优传输 (Screenkhorn)

低秩Sinkhorn

通过d-MMOT计算d维的重心

通过d-MMOT计算d维重心

一维不平衡最优运输

不平衡分布的1D Wasserstein重心演示

不平衡分布的1D Wasserstein 重心演示

ot.datasets.make_2D_samples_gauss(n, m, sigma, random_state=None)[源]

返回 n 个从二维高斯 \(\mathcal{N}(m, \sigma)\) 中提取的样本

Parameters:

n (int) – 要生成的样本数量
m (ndarray, shape (2,)) – 高斯分布的均值
sigma (ndarray, shape (2, 2)) – 高斯分布的协方差矩阵
random_state (int, RandomState 实例 或无, 可选 (默认=None)) – 如果是整数，random_state 是随机数生成器使用的种子；如果是 RandomState 实例，random_state 是随机数生成器；如果是无，随机数生成器是由 np.random 使用的 RandomState 实例。

Returns:

X – 从 \(\mathcal{N}(m, \sigma)\) 中抽取的 n 个样本。

Return type:

ndarray，形状 (n, 2)

使用 `ot.datasets.make_2D_samples_gauss` 的示例

二维经验分布之间的最优传输

格罗莫夫-瓦瑟斯坦例子

Gromov-Wasserstein 示例

二维分布上的切片瓦萨斯坦距离

精确和熵不平衡最优运输的二维示例

部分Wasserstein和Gromov-Wasserstein示例

部分沃瑟斯坦和格罗莫夫-沃瑟斯坦示例

l2-惩罚不平衡最优传输的正则化路径

l2惩罚不平衡最优运输的正则化路径

ot.datasets.make_data_classif(dataset, n, nz=0.5, theta=0, p=0.5, random_state=None, **kwargs)[源]

用于分类问题的数据集生成

Parameters:

dataset (str) – 分类问题的类型（见代码）
n (int) – 训练样本的数量
nz (float) – 噪声水平 (>0)
p (float) – 二元设置中某一类的比例
random_state (int, RandomState 实例 或无, 可选 (默认=None)) – 如果是整数，random_state 是随机数生成器使用的种子；如果是 RandomState 实例，random_state 是随机数生成器；如果是无，随机数生成器是由 np.random 使用的 RandomState 实例。

Returns:

X (ndarray, shape (n, d)) – n 个大小为 d 的观察值
y (ndarray, shape (n,)) – 样本的标签。

使用 `ot.datasets.make_data_classif` 的示例

用于熵和二次正则OT的双重OT求解器，使用Pytorch

使用Pytorch的熵型和二次正则化的双重OT求解器

用于领域适应的OT映射估计

用于经验分布的领域适应的 OT

多源目标偏移的OT

ot.datasets.make_1D_gauss(n, m, s)[源]

返回一个一维直方图用于高斯分布（n 个箱，均值 m 和标准差 s）

Parameters:

n (int) – 直方图中的箱子数量
m (float) – 高斯分布的均值
s (float) – 高斯分布的标准差

Returns:

h – 高斯分布的1D直方图

Return type:

ndarray (n,)

ot.datasets.make_2D_samples_gauss(n, m, sigma, random_state=None)[源]

返回 n 个从二维高斯 \(\mathcal{N}(m, \sigma)\) 中提取的样本

Parameters:

n (int) – 要生成的样本数量
m (ndarray, shape (2,)) – 高斯分布的均值
sigma (ndarray, shape (2, 2)) – 高斯分布的协方差矩阵
random_state (int, RandomState 实例 或无, 可选 (默认=None)) – 如果是整数，random_state 是随机数生成器使用的种子；如果是 RandomState 实例，random_state 是随机数生成器；如果是无，随机数生成器是由 np.random 使用的 RandomState 实例。

Returns:

X – 从 \(\mathcal{N}(m, \sigma)\) 中抽取的 n 个样本。

Return type:

ndarray，形状 (n, 2)

ot.datasets.make_data_classif(dataset, n, nz=0.5, theta=0, p=0.5, random_state=None, **kwargs)[源]

用于分类问题的数据集生成

Parameters:

dataset (str) – 分类问题的类型（见代码）
n (int) – 训练样本的数量
nz (float) – 噪声水平 (>0)
p (float) – 二元设置中某一类的比例
random_state (int, RandomState 实例 或无, 可选 (默认=None)) – 如果是整数，random_state 是随机数生成器使用的种子；如果是 RandomState 实例，random_state 是随机数生成器；如果是无，随机数生成器是由 np.random 使用的 RandomState 实例。

Returns:

X (ndarray, shape (n, d)) – n 个大小为 d 的观察值
y (ndarray, shape (n,)) – 样本的标签。

ot.datasets

函数

使用 ot.datasets.make_1D_gauss 的示例

使用 ot.datasets.make_2D_samples_gauss 的示例

使用 ot.datasets.make_data_classif 的示例

使用 `ot.datasets.make_1D_gauss` 的示例

使用 `ot.datasets.make_2D_samples_gauss` 的示例

使用 `ot.datasets.make_data_classif` 的示例