在本示例中,我们将把食品评论的嵌入向量上传至Atlas以可视化这些嵌入。
什么是Atlas?
Atlas 是一款机器学习工具,用于在网页浏览器中可视化海量嵌入数据集。您可以将数百万个嵌入上传到Atlas,并通过网页浏览器或Jupyter笔记本与之交互。
1. 登录Atlas。
!pip install nomicimport pandas as pd
import numpy as np
from ast import literal_eval
# Load the embeddings
datafile_path = "data/fine_food_reviews_with_embeddings_1k.csv"
df = pd.read_csv(datafile_path)
# Convert to a list of lists of floats
embeddings = np.array(df.embedding.apply(literal_eval).to_list())
df = df.drop('embedding', axis=1)
df = df.rename(columns={'Unnamed: 0': 'id'})
import nomic
from nomic import atlas
nomic.login('7xDPkYXSYDc1_ErdTPIcoAR9RNd8YDlkS3nVNXcVoIMZ6') #demo account
data = df.to_dict('records')
project = atlas.map_embeddings(embeddings=embeddings, data=data,
id_field='id',
colorable_fields=['Score'])
map = project.maps[0]2. 在Jupyter中与您的嵌入交互
map