设置Kedro

安装前提条件

  • Python: Kedro 支持 macOS、Linux 和 Windows 系统,要求 Python 3.9 及以上版本。在为 Kedro 项目创建虚拟环境时,您需要选择 Python 版本。

  • 虚拟环境: 您应该为每个新的Kedro项目创建一个新的虚拟环境,以将其Python依赖项与其他项目的依赖项隔离开来。

  • git: 如果您的机器上尚未安装git,则必须安装它。在终端窗口中输入git -v确认是否已安装;它将返回可用的git版本或错误信息。您可以从官方网站下载git

Python版本支持政策

  • 核心的Kedro Framework支持所有CPython核心团队积极维护的Python版本。当某个Python版本到达生命周期终止时,Kedro将停止对该版本的支持。这不被视为破坏性变更。

  • Kedro Datasets 包遵循 NEP 29 Python版本支持策略。这意味着 kedro-datasets 通常会在 kedro 之前停止对Python版本的支持。这是因为 kedro-datasets 有许多遵循NEP 29的依赖项,而Kedro框架较为保守的版本支持方法使得难以妥善管理这些依赖项。

为您的Kedro项目创建虚拟环境

如果您尚未使用虚拟环境管理器,我们强烈推荐使用venv

如何使用venv创建新的虚拟环境

推荐的方法。如果您使用Python 3,标准库中应该已经安装了venv模块。为项目工作创建一个目录并导航到该目录。例如:

mkdir your-kedro-project && cd your-kedro-project

接下来,在此目录中使用 venv 创建一个新的虚拟环境:

python -m venv .venv

激活此虚拟环境:

source .venv/bin/activate # macOS / Linux
.\.venv\Scripts\activate  # Windows

退出环境:

deactivate

如何使用conda创建新的虚拟环境

另一个流行的选择是使用Conda。安装完成后,在终端执行以下命令:

conda create --name kedro-environment python=3.10 -y

以下示例使用Python 3.10,并创建一个名为kedro-environment的虚拟环境。您可以为项目选择不同版本的Python(任何版本≥3.9且<3.12),并可以随意命名。

conda 虚拟环境不依赖于当前工作目录,可以从任何目录激活:

conda activate kedro-environment

要确认您的虚拟环境中安装了有效的Python版本,请在终端(macOS和Linux)中输入以下内容:

python3 --version

在Windows上:

python --version

退出 kedro-environment

conda deactivate

可选:在VS Code中通过官方扩展集成Kedro

在集成开发环境(IDE)中工作可以显著提高生产力。

VS Code用户:请查看设置Visual Studio CodeKedro VS Code扩展 PyCharm用户:请查看设置PyCharm

如何使用pip安装Kedro

要从Python包索引(PyPI)安装Kedro:

pip install kedro

你也可以使用conda install -c conda-forge kedro来安装Kedro。

如何验证您的Kedro安装

要确认Kedro已安装:

kedro info

您应该会看到一个ASCII艺术图形和Kedro版本号。例如:

如果未显示图形或安装过程中遇到任何问题,请查阅可搜索的Slack讨论存档,或在Slack组织上发布新查询。

如何升级Kedro

安全升级的最佳方式是查看我们的发布说明,了解任何重要的破坏性变更。按照该特定版本附带的迁移指南中的步骤进行操作。

安装Kedro后,您可以按以下方式检查版本:

kedro --version

要稍后升级Kedro到其他版本,只需运行:

pip install kedro -U

将现有项目迁移到较新版本的Kedro时,请确保同时更新kedro_init_version

  • 对于使用Kedro版本大于0.17.0生成的项目,您需要在项目根目录的pyproject.toml文件中进行此操作。

  • 如果你的项目是用Kedro版本<0.17.0生成的,你将需要更新位于src//run.py中的ProjectContext

概述

  • Kedro可在Windows、macOS或Linux系统上使用。

  • 安装前提条件包括虚拟环境管理器如 conda、Python 3.9+ 和 git

  • 您应该使用pip install kedro来安装Kedro。

如果在设置Kedro时遇到任何问题,可以在Kedro的Slack组织寻求帮助,或查阅Slack讨论的可搜索存档