了解Kedro
venv
conda
pip
kedro new
conf
src
pyproject.toml
settings.py
pipeline_registry.py
教程与基础Kedro使用
pipeline()
docs
kedro jupyter notebook
kedro.ipython
catalog
context
pipelines
session
%reload_kedro
%load_node
%run_viz
KedroContext
KedroSession
--params
create_default_data_set()
Runner
project_version
Kedro项目
OmegaConf
OmegaConfigLoader
ConfigLoader
TemplatedConfigLoader
catalog.yml
type
filepath
utf-8
kedro catalog rank
kedro catalog resolve
PartitionedDataset
fsspec
load
save
_describe
KedroDataCatalog
run
*args
**kwargs
describe
kedro pipeline create
SequentialRunner
ParallelRunner
kedro run
集成
conf/base/spark.yml
SparkSession
MemoryDataset
DataFrame
copy_mode="assign"
ThreadRunner
kedro-mlflow
开发
virtualenv
pytest
/tests
pytest-cov
ruff
pre-commit
高级用法
bootstrap_project
configure_project
click
global
project
cookiecutter
project_name
repo_name
python_package
DataCatalog
metadata
before_node_run
CONF_SOURCE
rich
kedro-sagemaker
kedro-azureml
kedro-databricks
kedro-kubeflow
kedro-vertexai
为Kedro贡献
命令行界面参考
API文档
load_ipython_extension()
KedroDeprecationWarning
KedroDeprecationWarning.args
KedroDeprecationWarning.with_traceback()
KedroPythonVersionWarning
KedroPythonVersionWarning.args
KedroPythonVersionWarning.with_traceback()
AbstractConfigLoader
MissingConfigException
AbstractDataset
AbstractVersionedDataset
CachedDataset
LambdaDataset
版本
DatasetAlreadyExistsError
DatasetError
DatasetNotFoundError
magic_load_node()
magic_reload_kedro()
reload_kedro()
RichHandler
node()
Pipeline
Node
ModularPipelineError
run_node()
AbstractRunner
load_obj()
定义数据目录生命周期钩子所有规范的命名空间。
方法
after_catalog_created(catalog, conf_catalog, ...)
after_catalog_created
在数据目录创建后要调用的钩子。
在数据目录创建后需要调用的钩子函数。 它会接收catalog以及 KedroContext._create_catalog的所有参数。
KedroContext._create_catalog
catalog (CatalogProtocol) – 已创建的目录。
CatalogProtocol
conf_catalog (dict[str, Any]) – 创建目录所使用的配置。
dict
str
Any
conf_creds (dict[str, Any]) – 创建目录时使用的凭据配置。
feed_dict (dict[str, Any]) – 创建后添加到目录中的feed_dict。
save_version (str) – 用于目录中所有数据集save操作的保存版本号。
load_versions (dict[str, str]) – 目录中每个数据集在load操作中使用的加载版本。
None