跳至内容

从文件中提取#

在n8n工作流中,一个常见模式是接收文件,这些文件可能来自HTTP请求节点(用于从网站获取文件)、Webhook节点(用于接收从其他地方发送到工作流的文件)或本地来源。通过这种方式获取的数据通常采用二进制格式,例如电子表格或PDF。

“从文件提取”节点可从二进制格式文件中提取数据并将其转换为JSON,这样工作流的后续部分就能轻松处理这些数据。如需将JSON转换回二进制文件类型,请参阅转换为文件节点。

操作#

使用操作下拉菜单选择要从中提取数据的源文件格式。

  • 从CSV提取:"逗号分隔值"文件类型通常用于表格数据。
  • Extract From HTML: Extract fields from standard web page HTML format files.
  • 从JSON提取: 从二进制文件中提取JSON数据。
  • 从ICS提取: 从iCalendar格式文件中提取字段。
  • 从ODS提取: 从ODS电子表格文件中提取字段。
  • 从PDF提取: 从便携式文档格式(PDF)文件中提取字段。
  • 从RTF提取: 从富文本格式文件中提取字段。
  • 从文本文件中提取: 从标准文本文件格式中提取字段。
  • 从XLS提取: 从Microsoft Excel文件(旧格式)中提取字段。
  • 从XLSX提取: 从Microsoft Excel文件中提取字段。
  • 将文件转换为Base64字符串: 将二进制数据转换为文本友好的base64格式。

示例工作流#

在此示例中,使用Webhook节点来触发工作流。当CSV文件发送到webhook地址时,文件数据会被输出并由Extract From File节点接收。

设置为'从CSV提取'模式后,该节点会将数据输出为一系列JSON格式的'行'对象:

1
2
3
4
5
6
7
8
{
  "row": {
  "0": "apple",
  "1": "1",
  "2": "2",
  "3": "3"
  }
  ...

通过webhook接收文件

选择Webhook节点的添加选项按钮并选择原始正文,然后启用该设置以使节点输出后续节点所需的二进制文件。

节点参数#

输入二进制字段#

输入节点输入数据中包含二进制文件的字段名称。默认为'data'。

目标输出字段#

输入节点输出中包含提取数据的字段名称。

此参数仅适用于以下操作:

  • 从JSON中提取
  • 从ICS文件中提取
  • 从文本文件中提取
  • 将文件转换为Base64字符串

模板和示例#

Building Your First WhatsApp Chatbot

作者:Jimleuk

查看模板详情
Extract text from a PDF file

作者:amudhan

查看模板详情
Scrape and store data from multiple website pages

作者:Miquel Colomer

查看模板详情
浏览从文件提取集成模板, or 搜索所有模板
优云智算