balanced_batch_generator#

imblearn.tensorflow.balanced_batch_generator(X, y, *, sample_weight=None, sampler=None, batch_size=32, keep_sparse=False, random_state=None)[source]#

创建一个平衡的批次生成器来训练tensorflow模型。

返回一个生成器——以及每个周期的步数——用于迭代获取小批量数据。采样器定义了在创建批次之前用于平衡数据集的采样策略。采样器应具有一个属性 sample_indices_

在版本0.4中添加。

Parameters:
Xndarray of shape (n_samples, n_features)

原始不平衡数据集。

yndarray of shape (n_samples,) or (n_samples, n_classes)

关联目标。

sample_weightndarray of shape (n_samples,), default=None

样本权重。

samplersampler object, default=None

一个具有属性sample_indices_的采样器实例。 默认情况下,使用的采样器是 RandomUnderSampler

batch_sizeint, default=32

每次梯度更新的样本数量。

keep_sparsebool, default=False

是否保留输入 X 的稀疏性。默认情况下,返回的批次将是密集的。

random_stateint, RandomState instance, default=None

控制算法的随机化。

  • 如果是整数,random_state 是随机数生成器使用的种子;

  • 如果 RandomState 实例,random_state 是随机数生成器;

  • 如果 None,随机数生成器是 np.random 使用的 RandomState 实例。

Returns:
generatorgenerator of tuple

生成一批数据。生成的元组可能是 (X_batch, y_batch) 或 (X_batch, y_batch, sampler_weight_batch)。

steps_per_epochint

每个周期的样本数量。