从文件中提取#
在n8n工作流中,一个常见模式是接收文件,这些文件可能来自HTTP请求节点(用于从网站获取文件)、Webhook节点(用于接收从其他地方发送到工作流的文件)或本地来源。通过这种方式获取的数据通常采用二进制格式,例如电子表格或PDF。
“从文件提取”节点可从二进制格式文件中提取数据并将其转换为JSON,这样工作流的后续部分就能轻松处理这些数据。如需将JSON转换回二进制文件类型,请参阅转换为文件节点。
操作#
使用操作下拉菜单选择要从中提取数据的源文件格式。
- 从CSV提取:"逗号分隔值"文件类型通常用于表格数据。
- Extract From HTML: Extract fields from standard web page HTML format files.
- 从JSON提取: 从二进制文件中提取JSON数据。
- 从ICS提取: 从iCalendar格式文件中提取字段。
- 从ODS提取: 从ODS电子表格文件中提取字段。
- 从PDF提取: 从便携式文档格式(PDF)文件中提取字段。
- 从RTF提取: 从富文本格式文件中提取字段。
- 从文本文件中提取: 从标准文本文件格式中提取字段。
- 从XLS提取: 从Microsoft Excel文件(旧格式)中提取字段。
- 从XLSX提取: 从Microsoft Excel文件中提取字段。
- 将文件转换为Base64字符串: 将二进制数据转换为文本友好的base64格式。
示例工作流#
在此示例中,使用Webhook节点来触发工作流。当CSV文件发送到webhook地址时,文件数据会被输出并由Extract From File节点接收。
设置为'从CSV提取'模式后,该节点会将数据输出为一系列JSON格式的'行'对象:
1 2 3 4 5 6 7 8 | |
通过webhook接收文件
选择Webhook节点的添加选项按钮并选择原始正文,然后启用该设置以使节点输出后续节点所需的二进制文件。
节点参数#
输入二进制字段#
输入节点输入数据中包含二进制文件的字段名称。默认为'data'。
目标输出字段#
输入节点输出中包含提取数据的字段名称。
此参数仅适用于以下操作:
- 从JSON中提取
- 从ICS文件中提取
- 从文本文件中提取
- 将文件转换为Base64字符串