FirecrawlSearchTool

描述

Firecrawl 是一个用于爬取并将任何网站转换为干净的 Markdown 或结构化数据的平台。

安装

  • firecrawl.dev获取API密钥,并在环境变量中设置它(FIRECRAWL_API_KEY)。
  • 安装Firecrawl SDK以及crewai[tools]包:
pip install firecrawl-py 'crewai[tools]'

示例

按如下方式使用FirecrawlSearchTool,以允许您的代理加载网站:

Code
from crewai_tools import FirecrawlSearchTool

tool = FirecrawlSearchTool(query='what is firecrawl?')

参数

  • api_key: 可选。指定Firecrawl API密钥。默认为FIRECRAWL_API_KEY环境变量。
  • query: 用于搜索的查询字符串。
  • page_options: 可选。用于结果格式化的选项。
    • onlyMainContent: 可选。仅返回页面的主要内容,不包括页眉、导航、页脚等。
    • includeHtml: 可选。包含页面的原始HTML内容。将在响应中输出一个html键。
    • fetchPageContent: 可选。获取页面的完整内容。
  • search_options: 可选的。控制爬取行为的选项。
    • limit: 可选的。最大爬取页面数。

这个页面有帮助吗?