2023年3月28日

在Atlas中可视化嵌入

在本示例中,我们将把食品评论的嵌入向量上传至Atlas以可视化这些嵌入。

什么是Atlas?

Atlas 是一款机器学习工具,用于在网页浏览器中可视化海量嵌入数据集。您可以将数百万个嵌入上传到Atlas,并通过网页浏览器或Jupyter笔记本与之交互。

!pip install nomic
import pandas as pd
import numpy as np
from ast import literal_eval

# Load the embeddings
datafile_path = "data/fine_food_reviews_with_embeddings_1k.csv"
df = pd.read_csv(datafile_path)

# Convert to a list of lists of floats
embeddings = np.array(df.embedding.apply(literal_eval).to_list())
df = df.drop('embedding', axis=1)
df = df.rename(columns={'Unnamed: 0': 'id'})
import nomic
from nomic import atlas
nomic.login('7xDPkYXSYDc1_ErdTPIcoAR9RNd8YDlkS3nVNXcVoIMZ6') #demo account

data = df.to_dict('records')
project = atlas.map_embeddings(embeddings=embeddings, data=data,
                               id_field='id',
                               colorable_fields=['Score'])
map = project.maps[0]
map

项目: meek-laborer

投影ID: 463f4614-7689-47e4-b55b-1da0cc679559

隐藏嵌入式项目