哈希多样性信息

class HashDiversityInfo(uniques_per_representation: list[float], uniques_total: float)[来源]

基础:NamedTuple

比率信息对象。

一对 unique_per_repr, unique_total,其中 unique_per_repr 是一个列表,包含每个标记表示的唯一哈希的百分比,而 unique_total 是当我们连接所有标记表示时唯一哈希的频率。

创建 HashDiversityInfo(uniques_per_representation, uniques_total) 的新实例

属性摘要

uniques_per_representation

一个按创建顺序列出每个表示的比率的列表,例如,对于AnchorTokenizationRelationTokenization[0.58, 0.82]

uniques_total

将所有的表示组合成一个矩阵时的唯一行的标量比率,例如0.95。

属性文档

Parameters:
uniques_per_representation: list[float]

一个按创建顺序列出每个表示的比率的列表, 例如,[0.58, 0.82] 用于 AnchorTokenizationRelationTokenization

uniques_total: float

将所有表示组合成一个矩阵时的唯一行的标量比率,例如0.95