Lance ❤️ HuggingFace

HuggingFace Hub已成为机器学习从业者寻找预训练模型和实用数据集的首选平台。

HuggingFace数据集可以直接通过lance.write_dataset()方法写入Lance格式。您可以写入整个数据集或特定拆分。例如:

# Huggingface datasets
import datasets
import lance

lance.write_dataset(datasets.load_dataset(
    "poloclub/diffusiondb", split="train[:10]",
), "diffusiondb_train.lance")