匿名遥测数据¶
为了帮助Kedro项目维护者改进软件, Kedro可以收集匿名遥测数据。 收集这些数据的唯一目的是通过了解功能使用情况来改进Kedro。 重要的是,我们不会存储您的个人信息或项目中的敏感数据, 且此过程绝不会用于营销或推广目的。 参与此计划是可选的,默认情况下是启用的。如果您选择退出,Kedro仍将正常工作。
Kedro项目的遥测功能已通过LF Projects, LLC的遥测数据收集与使用政策审核并获得批准。
Kedro通过Kedro-Telemetry插件收集匿名遥测数据,该插件作为Kedro的依赖项之一安装。
收集的数据字段:¶
唯一用户标识符(UUID): UUID是一个随机生成的匿名标识符,存储在Kedro的特定操作系统配置文件夹中,名为
telemetry.toml。如果UUID不存在,遥测插件会生成一个新的UUID并存储它,然后在后续的遥测事件中使用这个UUID。CLI命令(隐藏参数): 使用的命令,敏感参数已隐藏以保护隐私。示例输入:
kedro run --pipeline=ds --env=test我们接收到的:kedro run --pipeline ***** --env *****项目UUID: 项目UUID(随机生成的匿名项目标识符)和包名称的哈希值。如果项目UUID尚不存在,遥测插件会生成一个新的UUID,将其存储在
pyproject.toml中,然后将此项目UUID与包名称连接,对连接结果进行哈希处理,并在后续的遥测事件中使用。Kedro项目版本: 当前使用的Kedro版本。
Kedro-Telemetry 版本: Kedro-Telemetry 插件的版本号。
Python版本: 当前使用的Python版本。
操作系统: 运行Kedro的操作系统。
所选工具及示例管道: 在执行
kedro new命令时选择的工具和包含的示例管道(如适用)。数据集、节点和管道的数量: 关于项目结构的量化数据。
如需了解遥测收集工作的技术细节,您可以浏览
the source code of kedro-telemetry。
如何撤回同意?¶
要撤回同意,您有以下几种选择:
设置环境变量: 将环境变量
DO_NOT_TRACK或KEDRO_DISABLE_TELEMETRY设置为任意值。这些环境变量的存在将禁用该环境中所有Kedro项目的遥测功能,并会覆盖特定项目.telemetry文件中指定的任何同意设置。创建新项目时的CLI选项: 在创建新项目时,您可以使用以下命令:
kedro new --telemetry=no这将在项目根目录下创建一个包含
.telemetry文件的新项目,该文件内容为consent: false。当在该项目文件夹中执行Kedro命令时,将使用此文件。请注意,如果尚未通过环境变量禁用遥测功能,关于kedro new命令执行的遥测数据仍会被发送。
注意
.telemetry 文件不应提交到 git 或包含在部署包中。在 kedro>=0.17.4 版本中,该文件已被 git 忽略。
手动修改或创建
.telemetry文件: 如果在Kedro项目的根目录下已存在.telemetry文件,请将consent变量设置为false。如果该文件不存在,请创建并包含以下内容:consent: false
卸载插件: 移除
kedro-telemetry插件:pip uninstall kedro-telemetry
注意
这是最后的选择,因为它会破坏Kedro的依赖关系(例如,pip check会报告问题)。