简单随机搜索 (SRS)

class pypop7.optimizers.rs.srs.SRS(problem, options)[source]

简单随机搜索 (SRS)。

注意

SRS 是一种自适应的随机搜索方法,最初由Rosenstein和Barto设计,用于强化学习中的直接策略搜索。 由于它使用了一种简单的基于个体的随机采样策略,因此在大规模黑箱优化(LSBBO)中很容易遇到 有限的探索能力问题。因此, 强烈建议首先尝试更先进的(例如基于群体的)方法来进行LSBBO。

我们在这里包含它主要是为了基准测试的目的。

Parameters:
  • 问题 (字典) –

    问题参数包含以下常见设置 ():
    • ’fitness_function’ - 需要最小化的目标函数 (函数),

    • ’ndim_problem’ - 维度数 (整数),

    • ’upper_boundary’ - 搜索范围的上限 (类数组),

    • ’lower_boundary’ - 搜索范围的下限 (类数组).

  • options (dict) –

    具有以下常见设置的优化器选项 (keys):
    • ’max_function_evaluations’ - 函数评估的最大次数 (int, 默认: np.inf),

    • ’max_runtime’ - 允许的最大运行时间 (float, 默认: np.inf),

    • ’seed_rng’ - 随机数生成的种子,需要显式设置 (int);

    以及以下特定设置 (keys):
    • ’sigma’ - 初始全局步长 (float),

    • ’x’ - 初始(起始)点 (array_like),

      • 如果未给出,将从均匀分布中随机抽取一个样本,其搜索范围由 problem[‘lower_boundary’]problem[‘upper_boundary’] 限定。

    • ’alpha’ - 全局步长的因子 (float, 默认: 0.3),

    • ’beta’ - 探索-开发权衡的调整概率 (float, 默认: 0.0),

    • ’gamma’ - 搜索衰减的因子 (float, 默认: 0.99),

    • ’min_sigma’ - 全局步长的最小值 (float, 默认: 0.01).

示例

使用优化器来最小化著名的测试函数 Rosenbrock:

 1>>> import numpy
 2>>> from pypop7.benchmarks.base_functions import rosenbrock  # function to be minimized
 3>>> from pypop7.optimizers.rs.srs import SRS
 4>>> problem = {'fitness_function': rosenbrock,  # define problem arguments
 5...            'ndim_problem': 2,
 6...            'lower_boundary': -5*numpy.ones((2,)),
 7...            'upper_boundary': 5*numpy.ones((2,))}
 8>>> options = {'max_function_evaluations': 5000,  # set optimizer options
 9...            'seed_rng': 2022,
10...            'x': 3*numpy.ones((2,)),
11...            'sigma': 0.1}
12>>> srs = SRS(problem, options)  # initialize the optimizer class
13>>> results = srs.optimize()  # run the optimization process
14>>> # return the number of used function evaluations and found best-so-far fitness
15>>> print(f"SRS: {results['n_function_evaluations']}, {results['best_so_far_y']}")
16SRS: 5000, 0.0017821578376762473

由于其编码的正确性检查,基于代码的可重复性报告由于原论文中缺乏其模拟环境而无法提供。相反,我们使用了基于比较的策略来尽可能验证其正确性(尽管仍然存在出错的风险)。

alpha

全局步长因子。

Type:

float

beta

探索-开发权衡的调整概率。

Type:

float

gamma

搜索衰减因子。

Type:

float

min_sigma

全局步长的最小值。

Type:

float

sigma

最终的全局步长(在优化过程中更新)。

Type:

float

x

初始(起始)点。

Type:

array_like

参考文献

Rosenstein, M.T. 和 Grupen, R.A., 2002年5月. 速度依赖的动态可操作性. 在IEEE国际机器人与自动化会议论文集 (第2424-2429页). IEEE. https://ieeexplore.ieee.org/abstract/document/1013595

Rosenstein, M.T. 和 Barto, A.G., 2001年8月. 通过直接策略搜索实现机器人举重. 在国际人工智能联合会议上 (第839-846页). https://dl.acm.org/doi/abs/10.5555/1642194.1642206