skfolio.optimization.DistributionallyRobustCVaR#

class skfolio.optimization.DistributionallyRobustCVaR(risk_aversion=1.0, cvar_beta=0.95, wasserstein_ball_radius=0.02, prior_estimator=None, min_weights=0.0, max_weights=1.0, budget=1, min_budget=None, max_budget=None, max_short=None, max_long=None, groups=None, linear_constraints=None, left_inequality=None, right_inequality=None, risk_free_rate=0.0, solver='CLARABEL', solver_params=None, scale_objective=None, scale_constraints=None, save_problem=False, raise_on_failure=True, add_objective=None, add_constraints=None, overwrite_expected_return=None, portfolio_params=None)[来源]#

分布鲁棒CVaR。

分布鲁棒CVaR模型在多元和非离散概率分布的空间中构造一个Wasserstein球,中心位于训练样本上的均匀分布,并找到最小化此Wasserstein球内最坏情况下分布的CVaR的分配。Esfahani和Kuhn [1] 证明,对于分段线性目标函数,即CVaR [2]的情况,分布鲁棒优化问题可以重新表述为有限凸规划。

仅支持分段线性函数,这意味着不允许交易成本和正则化。

一个像 Mosek 这样的求解器,能够处理大量约束是更受欢迎的。

Parameters:
cvar_betafloat, default=0.95

CVaR(条件风险价值)置信水平。

risk_aversionfloat, default=1.0

效用函数的风险厌恶因子:返回 - 风险厌恶 * cvar。

wasserstein_ball_radius: float, default=0.02

沃瑟斯坦球的半径。

prior_estimatorBasePrior, optional

先验估计器. 先验估计器用于估计PriorModel 包含资产预期收益、协方差矩阵、收益和协方差的Cholesky分解的估计。 默认值(None)是使用EmpiricalPrior

min_weightsfloat | dict[str, float] | array-like of shape (n_assets, ) | None, default=0.0

最小资产权重(权重下限)。 如果提供了浮动值,则应用于每个资产。 None 等价于 -np.Inf (没有下限)。 如果提供了字典,其(键/值)对必须是 (资产名称/资产最小权重),输入 Xfit 方法必须是一个包含资产名称的 DataFrame。 当使用字典时,未提供的资产值将被分配最小权重 0.0。 默认值是 0.0 (不允许做空)。

示例:

  • min_weights = 0 –> 仅限于多头投资组合(不进行卖空)。

  • min_weights = None –> 没有下界(与 -np.Inf 相同)。

  • min_weights = -2 –> 每个权重必须高于 -200%。

  • min_weights = {"SX5E": 0, "SPX": -2}

  • min_weights = [0, -2]

max_weightsfloat | dict[str, float] | array-like of shape (n_assets, ) | None, default=1.0

最大资产权重(权重上限)。
如果提供一个浮点数,它会应用于每个资产。None 相当于 +np.Inf(没有上限)。
如果提供一个字典,它的(键/值)对必须是(资产名称/资产最大权重),而输入 Xfit 方法必须是一个包含资产名称的列的 DataFrame。
当使用字典时,未提供的资产值被分配最小权重 1.0
默认值是 1.0(每个资产低于 100%。)

示例:

  • max_weights = 0 –> 不持有多头头寸(仅空头投资组合)。

  • max_weights = None –> 没有上限。

  • max_weights = 2 –> 每个权重必须低于200%。

  • max_weights = {"SX5E": 1, "SPX": 2}

  • max_weights = [1, 2]

budgetfloat | None, default=1.0

投资预算。它是多头和空头头寸的总和(所有权重的总和)。 None 意味着没有预算限制。 默认值是 1.0 (完全投资的投资组合)。

示例:

  • budget = 1 –> 完全投资组合。

  • budget = 0 –> 市场中性投资组合。

  • budget = None –> 对权重之和没有限制。

min_budgetfloat, optional

最低预算。它是多头和空头头寸总和的下限 (所有权重的总和)。如果提供,您必须设置 budget=None。 默认值 (None) 意味着没有最低预算限制。

max_shortfloat, optional

最大空头头寸。空头头寸定义为负权重的总和(按绝对值计算)。 默认值(None)表示没有最大空头头寸。

max_longfloat, optional

最大多头头寸。多头头寸被定义为正权重的总和。 默认值(None)表示没有最大多头头寸。

max_budgetfloat, optional

最大预算。它是多头和空头头寸之和的上限(所有权重之和)。如果提供,您必须设置 budget=None。默认值 (None) 意味着没有最大预算约束。

linear_constraintsarray-like of shape (n_constraints,), optional

线性约束。 线性约束必须符合以下任意模式:

  • “2.5 * ref1 + 0.10 * ref2 + 0.0013 <= 2.5 * ref3”

  • “ref1 >= 2.9 * ref2”

  • “ref1 == ref2”

  • “ref1 >= ref1”

通过“ref1”、“ref2”……在参数 groups 中提供的资产名称或组名称。 如果输入 Xfit 方法是一个具有这些资产名称的列的 DataFrame,则可以不需要 groups 来引用资产名称。

示例:

  • “SPX >= 0.10” –> SPX 权重必须大于 10% (请注意,您也可以使用 min_weights)

  • “SX5E + TLT >= 0.2” –> SX5E和TLT权重的总和必须大于20%

  • “US == 0.7” –> 所有美国权重的总和必须等于70%

  • “股权 == 3 * 债券” –> 所有股权权重的总和必须等于所有债券权重的总和的3倍。

  • “2*SPX + 3*Europe <= Bond + 0.05” –> 混合资产和组约束

groupsdict[str, list[str]] or array-like of shape (n_groups, n_assets), optional

linear_constraints中引用的资产组。如果提供了字典,则其(键/值)对必须是(资产名称/资产组),并且fit方法的输入X必须是一个数据框,其中列包含资产名称。

示例:

  • groups = {“SX5E”: [“股票”, “欧洲”], “SPX”: [“股票”, “美国”], “TLT”: [“债券”, “美国”]}

  • groups = [[“股权”, “股权”, “债券”], [“欧洲”, “美国”, “美国”]]

left_inequalityarray-like of shape (n_constraints, n_assets), optional

线性约束的左侧不等式矩阵 \(A\) \(A \cdot w \leq b\)

right_inequalityarray-like of shape (n_constraints, ), optional

线性约束的右侧不等式向量 \(b\) \(A \cdot w \leq b\)

risk_free_ratefloat, default=0.0

无风险利率。 默认值为 0.0

add_constraintsCallable[[cp.Variable], cp.Expression|list[cp.Expression]], optional

向现有约束添加自定义约束或约束列表。 它是一个必须以权重 w 作为参数的函数,并返回一个 CVPXY 表达式或一个 CVPXY 表达式的列表。

overwrite_expected_returnCallable[[cp.Variable], cp.Expression], optional

用自定义表达式覆盖预期的回报 \(\mu \cdot w\)。 它是一个必须以权重 w 作为参数的函数,并返回一个 CVPXY 表达式。

solverstr, default=”CLARABEL”

要使用的求解器。默认是“CLARABEL”,它是用Rust编写的,具有比ECOS和SCS更好的数值稳定性和性能。Cvxpy将在未来版本中将其默认求解器“ECOS”替换为“CLARABEL”。有关可用求解器的更多详细信息,请查阅CVXPY文档:https://www.cvxpy.org/tutorial/advanced/index.html#choosing-a-solver

solver_paramsdict, optional

求解器参数。例如,solver_params=dict(verbose=True)。默认值(None) 是使用 {"tol_gap_abs": 1e-9, "tol_gap_rel": 1e-9} 作为求解器“CLARABEL”的参数,其他情况使用CVXPY的默认值。有关求解器参数的更多详细信息,请查看CVXPY文档:https://www.cvxpy.org/tutorial/advanced/index.html#setting-solver-options

scale_objectivefloat, optional

通过此值缩放每个目标元素。
它可以用于在特定情况下提高优化精度。
默认值(None)根据问题设置。

scale_constraintsfloat, optional

通过此值缩放每个约束元素。 它可以在特定情况下用于提高优化精度。 默认值(None)根据问题设置。

save_problembool, default=False

如果将此设置为 True,CVXPY 问题将保存在 problem_ 中。 默认值为 False

raise_on_failurebool, default=True

如果将此设置为 True,当优化失败时会引发错误,否则会以警告形式通过。

portfolio_paramsdict, optional

传递给通过 predictscore 方法评估的投资组合的投资组合参数。如果未提供,nametransaction_costsmanagement_feesprevious_weightsrisk_free_rate 将从优化模型中复制并传递给投资组合。

Attributes:
weights_ndarray of shape (n_assets,) or (n_optimizations, n_assets)

资产的权重。

problem_values_dict[str, float] | list[dict[str, float]] of size n_optimizations

从CVXPY问题中检索的表达式值。

prior_estimator_BasePrior

调整过的 prior_estimator.

problem_: cvxpy.Problem

用于优化的CVXPY问题。只有当 save_problem 被设置为 True 时。

n_features_in_int

fit期间看到的资产数量。

feature_names_in_ndarray of shape (n_features_in_,)

fit期间看到的资产名称。只有当X具有所有为字符串的资产名称时才定义。

参考文献

[1]

“基于数据的分布鲁棒优化使用Wasserstein度量:性能保证和可处理的重构”。 Esfahani 和 Kuhn(2018)。

[2]

“条件风险价值的优化”。 Rockafellar 和 Uryasev (2000)。

方法

fit(X[, y])

适配分布鲁棒的CVaR优化估计量。

fit_predict(X)

X 执行 fit 操作,并返回基于拟合的 weightsPortfolioPopulation 的预测结果。

get_metadata_routing()

获取此对象的元数据路由。

get_params([deep])

获取此估计器的参数。

predict(X)

根据拟合的权重预测PortfolioPopulationX上的Portfolio

score(X[, y])

预测分数。

set_params(**params)

设置此估计器的参数。

fit(X, y=None, **fit_params)[来源]#

拟合分布鲁棒的CVaR优化估计器。

Parameters:
Xarray-like of shape (n_observations, n_assets)

资产的价格收益。

yarray-like of shape (n_observations, n_factors), optional

因子的价格回报。 默认值是 None

**fit_paramsdict

传递给基础估计器的参数。只有在 enable_metadata_routing=True 的情况下可用,您可以通过使用 sklearn.set_config(enable_metadata_routing=True) 来设置。详情请参见 元数据路由用户指南

Returns:
selfDistributionallyRobustCVaR

拟合的估计器。

fit_predict(X)#

X执行fit并根据拟合的weights返回预测的PortfolioPopulationPortfolioX上的值。对于因子模型,分别使用fit(X, y)然后predict(X)

Parameters:
Xarray-like of shape (n_observations, n_assets)

资产的价格收益。

Returns:
predictionPortfolio | Population

基于拟合的 weights 估计的 PortfolioPopulationPortfolioX 上。

get_metadata_routing()#

获取这个对象的元数据路由。

请查看 用户指南 了解路由机制是如何工作的。

Returns:
routingMetadataRequest

一个 MetadataRequest 封装路由信息。

get_params(deep=True)#

获取此估计器的参数。

Parameters:
deepbool, default=True

如果为真,将返回此估计器及其包含的子对象的参数,这些子对象也是估计器。

Returns:
paramsdict

参数名称映射到它们的值。

predict(X)#

根据拟合的权重预测PortfolioPopulationX上的Portfolio

优化估计器可以返回一个一维或二维数组的 weights。对于一维数组,预测返回一个 Portfolio。对于二维数组,预测返回一个 PopulationPortfolio

如果 name 在投资组合参数中没有提供,我们将使用估计器名称的前 500 个字符。

Parameters:
Xarray-like of shape (n_observations, n_assets)

资产的价格收益。

Returns:
predictionPortfolio | Population

基于拟合的 weights 估计的 PortfolioPopulationPortfolioX 上。

score(X, y=None)#

预测分数。 如果预测是单个 Portfolio,则分数是夏普比率。 如果预测是一组 PopulationPortfolio,则分数是该组中所有投资组合夏普比率的平均值。

Parameters:
Xarray-like of shape (n_observations, n_assets)

资产的价格收益。

yIgnored

未使用,仅为了遵循API一致性而存在。

Returns:
scorefloat

如果预测是单个 Portfolio,则投资组合的夏普比率为;如果预测是 PortfolioPopulation 的所有投资组合夏普比率的平均值。

set_params(**params)#

设置该估计器的参数。

该方法适用于简单估计器以及嵌套对象(如 Pipeline)。后者具有 <component>__<parameter> 形式的参数,因此可以更新嵌套对象的每个组件。

Parameters:
**paramsdict

估计器参数。

Returns:
selfestimator instance

估计器实例。