Apify
ApifyActor #
基类: BaseReader
Apify Actor 读取器。 调用 Apify 平台上的 Actor 并在其完成后读取生成的数据集。
参数:
| 名称 | 类型 | 描述 | 默认值 |
|---|---|---|---|
apify_api_token
|
str
|
Apify API令牌。 |
required |
Source code in llama-index-integrations/readers/llama-index-readers-apify/llama_index/readers/apify/actor/base.py
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 | |
加载数据 #
load_data(actor_id: str, run_input: Dict, dataset_mapping_function: Callable[[Dict], Document], *, build: Optional[str] = None, memory_mbytes: Optional[int] = None, timeout_secs: Optional[int] = None) -> List[Document]
调用Apify平台上的一个Actor,等待其完成并返回结果数据集。
参数:
| 名称 | 类型 | 描述 | 默认值 |
|---|---|---|---|
actor_id
|
str
|
执行者的ID或名称。 |
required |
run_input
|
Dict
|
您尝试运行的Actor的输入对象。 |
required |
dataset_mapping_function
|
Callable
|
一个函数,接收单个字典(Apify数据集项)并将其转换为Document类的实例。 |
required |
build
|
str
|
可选地指定要运行的Actor构建。可以是构建标签或构建编号。 |
None
|
memory_mbytes
|
int
|
运行时的可选内存限制,单位为兆字节。 |
None
|
timeout_secs
|
int
|
运行的可选超时时间,单位为秒。 |
None
|
返回:
| 类型 | 描述 |
|---|---|
List[Document]
|
List[Document]: 文档列表。 |
Source code in llama-index-integrations/readers/llama-index-readers-apify/llama_index/readers/apify/actor/base.py
33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 | |
Apify数据集 #
基类: BaseReader
Apify数据集读取器。 用于读取Apify平台上的数据集。
参数:
| 名称 | 类型 | 描述 | 默认值 |
|---|---|---|---|
apify_api_token
|
str
|
Apify API令牌。 |
required |
Source code in llama-index-integrations/readers/llama-index-readers-apify/llama_index/readers/apify/dataset/base.py
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 | |
加载数据 #
从Apify数据集加载数据。
参数:
| 名称 | 类型 | 描述 | 默认值 |
|---|---|---|---|
dataset_id
|
str
|
数据集ID。 |
required |
dataset_mapping_function
|
Callable[[Dict], Document]
|
将数据集项映射到Document的函数。 |
required |
返回:
| 类型 | 描述 |
|---|---|
List[Document]
|
List[Document]: 文档列表。 |
Source code in llama-index-integrations/readers/llama-index-readers-apify/llama_index/readers/apify/dataset/base.py
31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 | |