迁移指南¶
v0.3 迁移指南¶
数据创建¶
从v0.3版本开始,之前的数据创建库移至legacy包中。
替代传统数据创建方式,引入了beta包。
数据中不再存在beta包,您无需导入beta即可使用。
例如,
v0.2版本
from autorag.data.corpus import langchain_documents_to_parquet
from autorag.data.qacreation import generate_qa_llama_index, make_single_content_qa
from autorag.data.beta.query.llama_gen_query import factoid_query_gen
from autorag.data.beta.sample import random_single_hop
from autorag.data.beta.schema import Raw
v0.3版本
from autorag.data.legacy.corpus import langchain_documents_to_parquet
from autorag.data.legacy.qacreation import generate_qa_llama_index, make_single_content_qa
from autorag.data.qa.query.llama_gen_query import factoid_query_gen
from autorag.data.qa.sample import random_single_hop
from autorag.data.qa.schema import Raw
v0.3.7 迁移指南¶
在v0.3.6版本中,向量数据库有所变更。 您需要在配置YAML文件中指定要使用的向量数据库类型。
v0.3.6版本(前一个版本v0.3.7)
node_lines:
- node_line_name: retrieve_node_line
nodes:
- node_type: retrieval # represents run_node function
strategy: # essential for every node
metrics: [retrieval_f1, retrieval_recall]
top_k: 10 # node param, which adapt to every module in this node.
modules:
- module_type: bm25
bm25_tokenizer: [ facebook/opt-125m, porter_stemmer ]
- module_type: vectordb
embedding_model: [openai_embed_3_large, openai_embed_3_small]
- module_type: hybrid_rrf
weight_range: (4, 30)
v0.3.7 版本
vectordb:
- name: openai_embed_3_small
db_type: chroma
client_type: persistent
embedding_model: openai_embed_3_small
collection_name: openai_embed_3_small
path: ${PROJECT_DIR}/resources/chroma
- name: openai_embed_3_large
db_type: chroma
client_type: persistent
embedding_model: openai_embed_3_large
collection_name: openai_embed_3_large
path: ${PROJECT_DIR}/resources/chroma
embedding_batch: 50
node_lines:
- node_line_name: retrieve_node_line
nodes:
- node_type: retrieval # represents run_node function
strategy: # essential for every node
metrics: [retrieval_f1, retrieval_recall]
top_k: 10 # node param, which adapt to every module in this node.
modules:
- module_type: bm25
bm25_tokenizer: [ facebook/opt-125m, porter_stemmer ]
- module_type: vectordb
vectordb: [openai_embed_3_large, openai_embed_3_small]
- module_type: hybrid_rrf
weight_range: (4, 30)
如需了解更多关于向量数据库的信息,请参阅vectordb文档。