发布说明

关于各个版本中新功能的一些说明

0.5版本的新内容

  • ParametricUMAP 使用神经网络学习嵌入。

  • AlignedUMAP 可以使用数据集之间的关系对齐多个嵌入。

  • DensMAP 可以在嵌入中保留局部密度信息。

  • UMAP 现在依赖于 PyNNDescent,但因此具有更快、更并行的性能。

  • UMAP 现在支持一个 update 方法来添加新数据并重新训练。

  • 各种性能改进和错误修复。

  • 额外的绘图支持,包括在交互式图中进行文本搜索。

  • 支持邻居图中的“最大距离”。

0.4版本的新内容

  • 新指标,包括用于稀疏计数数据的Hellinger距离。

  • 支持邻居搜索和布局优化中的并行性。(感谢Tom White)

  • 支持处理重复数据样本的替代方法。(感谢 John Healy)

  • 新的绘图方法,用于快速简便的绘图。

  • 初步支持数据框嵌入——仍处于实验阶段,但值得尝试。

  • 支持使用稀疏数据进行变换方法。

  • 当未设置随机种子时支持多线程。

0.3版本的新内容

  • 监督和半监督降维。支持使用标签或部分标签进行降维。

  • 变换方法。支持向现有嵌入中添加新的未见点。

  • 性能改进。

0.2版本的新内容

  • 一种新的布局算法,能够更正确地处理大型数据集。

  • 性能改进。