balanced_batch_generator#
- imblearn.tensorflow.balanced_batch_generator(X, y, *, sample_weight=None, sampler=None, batch_size=32, keep_sparse=False, random_state=None)[source]#
创建一个平衡的批次生成器来训练tensorflow模型。
返回一个生成器——以及每个周期的步数——用于迭代获取小批量数据。采样器定义了在创建批次之前用于平衡数据集的采样策略。采样器应具有一个属性
sample_indices_
。在版本0.4中添加。
- Parameters:
- Xndarray of shape (n_samples, n_features)
原始不平衡数据集。
- yndarray of shape (n_samples,) or (n_samples, n_classes)
关联目标。
- sample_weightndarray of shape (n_samples,), default=None
样本权重。
- samplersampler object, default=None
一个具有属性
sample_indices_
的采样器实例。 默认情况下,使用的采样器是RandomUnderSampler
。- batch_sizeint, default=32
每次梯度更新的样本数量。
- keep_sparsebool, default=False
是否保留输入
X
的稀疏性。默认情况下,返回的批次将是密集的。- random_stateint, RandomState instance, default=None
控制算法的随机化。
如果是整数,
random_state
是随机数生成器使用的种子;如果
RandomState
实例,random_state 是随机数生成器;如果
None
,随机数生成器是np.random
使用的RandomState
实例。
- Returns:
- generatorgenerator of tuple
生成一批数据。生成的元组可能是 (X_batch, y_batch) 或 (X_batch, y_batch, sampler_weight_batch)。
- steps_per_epochint
每个周期的样本数量。