tsfresh.scripts 包

子模块

tsfresh.scripts.measure_execution_time 模块

class tsfresh.scripts.measure_execution_time.CombinerTask(*args, **kwargs)[源代码]

基类:Task

将所有任务收集到一个单独的 result.csv 文件中。

complete()[源代码]

如果任务有任何输出,如果所有输出都存在则返回 True 。否则,返回 False

然而,你可以自由地用自定义逻辑覆盖此方法。

output()[源代码]

此任务产生的输出。

任务的输出决定了任务是否需要运行——如果所有输出都存在,则认为任务已完成。子类应重写此方法以返回单个 TargetTarget 实例的列表。

实现说明

如果运行多个工作进程,输出必须是一个所有工作进程都可以访问的资源,例如DFS或数据库。否则,工作进程可能会计算相同的输出,因为它们看不到其他工作进程完成的工作。

参见 Task.output

requires()[源代码]

此任务所依赖的任务。

一个任务只有在它所依赖的所有任务都完成后才会运行。如果你的任务不需要任何其他任务,那么你不需要重写这个方法。否则,子类可以重写这个方法来返回一个任务、一个任务实例列表,或者一个值为任务实例的字典。

参见 Task.requires

run()[源代码]

任务运行方法,在子类中需要被重写。

参见 Task.run

class tsfresh.scripts.measure_execution_time.DataCreationTask(*args, **kwargs)[源代码]

基类:Task

创建用于测试的随机数据

num_ids = <luigi.parameter.IntParameter object>
output()[源代码]

此任务产生的输出。

任务的输出决定了任务是否需要运行——如果所有输出都存在,则认为任务已完成。子类应重写此方法以返回单个 TargetTarget 实例的列表。

实现说明

如果运行多个工作进程,输出必须是一个所有工作进程都可以访问的资源,例如DFS或数据库。否则,工作进程可能会计算相同的输出,因为它们看不到其他工作进程完成的工作。

参见 Task.output

random_seed = <luigi.parameter.IntParameter object>
run()[源代码]

任务运行方法,在子类中需要被重写。

参见 Task.run

time_series_length = <luigi.parameter.IntParameter object>
class tsfresh.scripts.measure_execution_time.FullTimingTask(*args, **kwargs)[源代码]

基类:Task

使用所有计算器运行 tsfresh 进行比较

n_jobs = <luigi.parameter.IntParameter object>
num_ids = <luigi.parameter.IntParameter object>
output()[源代码]

此任务产生的输出。

任务的输出决定了任务是否需要运行——如果所有输出都存在,则认为任务已完成。子类应重写此方法以返回单个 TargetTarget 实例的列表。

实现说明

如果运行多个工作进程,输出必须是一个所有工作进程都可以访问的资源,例如DFS或数据库。否则,工作进程可能会计算相同的输出,因为它们看不到其他工作进程完成的工作。

参见 Task.output

random_seed = <luigi.parameter.IntParameter object>
requires()

此任务所依赖的任务。

一个任务只有在它所依赖的所有任务都完成后才会运行。如果你的任务不需要任何其他任务,那么你不需要重写这个方法。否则,子类可以重写这个方法来返回一个任务、一个任务实例列表,或者一个值为任务实例的字典。

参见 Task.requires

run()[源代码]

任务运行方法,在子类中需要被重写。

参见 Task.run

time_series_length = <luigi.parameter.IntParameter object>
class tsfresh.scripts.measure_execution_time.TimingTask(*args, **kwargs)[源代码]

基类:Task

使用给定的参数运行 tsfresh

feature_parameter = <luigi.parameter.DictParameter object>
n_jobs = <luigi.parameter.IntParameter object>
num_ids = <luigi.parameter.IntParameter object>
output()[源代码]

此任务产生的输出。

任务的输出决定了任务是否需要运行——如果所有输出都存在,则认为任务已完成。子类应重写此方法以返回单个 TargetTarget 实例的列表。

实现说明

如果运行多个工作进程,输出必须是一个所有工作进程都可以访问的资源,例如DFS或数据库。否则,工作进程可能会计算相同的输出,因为它们看不到其他工作进程完成的工作。

参见 Task.output

random_seed = <luigi.parameter.IntParameter object>
requires()

此任务所依赖的任务。

一个任务只有在它所依赖的所有任务都完成后才会运行。如果你的任务不需要任何其他任务,那么你不需要重写这个方法。否则,子类可以重写这个方法来返回一个任务、一个任务实例列表,或者一个值为任务实例的字典。

参见 Task.requires

run()[源代码]

任务运行方法,在子类中需要被重写。

参见 Task.run

time_series_length = <luigi.parameter.IntParameter object>
try_number = <luigi.parameter.IntParameter object>

tsfresh.scripts.run_tsfresh 模块

此脚本可以通过以下方式运行:

python run_tsfresh.py path_to_your_csv.csv

相应的包含时间序列特征的csv文件将被保存为 features_path_to_your_csv.csv

不过,有一些限制

  • 目前这仅采样前50个值。

  • 你的 csv 文件必须以空格分隔。

  • 输出保存为 path_to_your_csv.features.csv

tsfresh.scripts.run_tsfresh.main(console_args=None)[源代码]

tsfresh.scripts.test_timing 模块

tsfresh.scripts.test_timing.measure_temporal_complexity()[源代码]
tsfresh.scripts.test_timing.plot_results()[源代码]
tsfresh.scripts.test_timing.simulate_with_length(length, df)[源代码]

模块内容