PyPortfolioOpt是一个实现投资组合优化方法的库,包括经典的均值-方差优化技术和Black-Litterman配置,以及该领域的一些最新发展,如收缩和层次风险平价。
它既全面又易于扩展,可以为普通投资者或寻求简单原型工具的专业人士提供帮助。无论你是一个发现了少数被低估股票的基本面投资者,还是拥有一篮子策略的算法交易者,PyPortfolioOpt都可以帮助你以风险效率的方式组合你的alpha来源。
PyPortfolioOpt已在开源软件期刊上发表 🎉
PyPortfolioOpt现由Tuan Tran维护。
前往**ReadTheDocs上的文档**深入了解该项目,或查看cookbook以查看从下载数据到构建投资组合的完整过程示例。
目录
入门
如果你想在浏览器中交互式地试用PyPortfolioOpt,可以在这里启动Binder。虽然设置需要一些时间,但它可以让你尝试cookbook中的示例,而无需处理所有依赖项。
注意:macOS用户需要安装命令行工具。
注意:如果你使用Windows系统,首先需要安装C++。(下载,安装说明)
该项目可在PyPI上获得,这意味着你只需:
pip install PyPortfolioOpt
(你可能需要按照单独的安装说明安装cvxopt和cvxpy)。
然而,最佳实践是在虚拟环境中使用依赖管理器。 我目前的建议是使用poetry进行设置,然后运行
poetry add PyPortfolioOpt
或者,克隆/下载项目并在项目目录中运行:
python setup.py install
PyPortfolioOpt支持Docker。使用docker build -f docker/Dockerfile . -t pypfopt
构建你的第一个容器。你可以使用该镜像运行测试或启动Jupyter服务器。
# iPython解释器:
docker run -it pypfopt poetry run ipython
# Jupyter notebook服务器:
docker run -it -p 8888:8888 pypfopt poetry run jupyter notebook --allow-root --no-browser --ip 0.0.0.0
# 点击http://127.0.0.1:8888/?token=xxx
# Pytest
docker run -t pypfopt poetry run pytest
# Bash
docker run -it pypfopt bash
更多信息,请阅读本指南。
开发用途
如果你想进行重大更改以将其集成到你的专有系统中,最好克隆此存储库并直接使用源代码。
git clone https://github.com/robertmartin8/PyPortfolioOpt
或者,你可以尝试:
pip install -e git+https://github.com/robertmartin8/PyPortfolioOpt.git
快速示例
以下是使用真实股票数据的示例,演示了如何轻松找到最大化夏普比率(风险调整后收益的衡量指标)的仅多头投资组合。
import pandas as pd
from pypfopt import EfficientFrontier
from pypfopt import risk_models
from pypfopt import expected_returns
# 读取价格数据
df = pd.read_csv("tests/resources/stock_prices.csv", parse_dates=True, index_col="date")
# 计算预期收益和样本协方差
mu = expected_returns.mean_historical_return(df)
S = risk_models.sample_cov(df)
# 优化以获得最大夏普比率
ef = EfficientFrontier(mu, S)
raw_weights = ef.max_sharpe()
cleaned_weights = ef.clean_weights()
ef.save_weights_to_file("weights.csv") # 保存到文件
print(cleaned_weights)
ef.portfolio_performance(verbose=True)
这将输出以下权重:
{'GOOG': 0.03835,
'AAPL': 0.0689,
'FB': 0.20603,
'BABA': 0.07315,
'AMZN': 0.04033,
'GE': 0.0,
'AMD': 0.0,
'WMT': 0.0,
'BAC': 0.0,
'GM': 0.0,
'T': 0.0,
'UAA': 0.0,
'SHLD': 0.0,
'XOM': 0.0,
'RRC': 0.0,
'BBY': 0.01324,
'MA': 0.35349,
'PFE': 0.1957,
'JPM': 0.0,
'SBUX': 0.01082}
预期年化收益率: 30.5%
年化波动率: 22.2%
夏普比率: 1.28
这些数据本身很有趣但不太实用。不过,PyPortfolioOpt提供了一种方法,可以将上述连续权重转换为您实际可以购买的分配。只需输入最新价格和所需的投资组合规模(本例中为10,000美元):
from pypfopt.discrete_allocation import DiscreteAllocation, get_latest_prices
latest_prices = get_latest_prices(df)
da = DiscreteAllocation(weights, latest_prices, total_portfolio_value=10000)
allocation, leftover = da.greedy_portfolio()
print("离散分配:", allocation)
print("剩余资金: ${:.2f}".format(leftover))
20个股票中有12个被移除
离散分配: {'GOOG': 1, 'AAPL': 4, 'FB': 12, 'BABA': 4, 'BBY': 2,
'MA': 20, 'PFE': 54, 'SBUX': 1}
剩余资金: $11.89
免责声明:本项目不构成投资建议,作者对您后续的投资决策不承担任何责任。更多信息请参阅许可证。
经典投资组合优化方法概述
Harry Markowitz 1952年的论文无疑是一个经典,它将投资组合优化从艺术转变为科学。其关键洞见是,通过结合具有不同预期收益和波动性的资产,可以决定一个数学上最优的分配,在目标收益下最小化风险 - 所有这些最优投资组合的集合被称为有效前沿。
尽管该主题已有了很大发展,但半个多世纪后,Markowitz的核心思想仍然具有根本重要性,并在许多投资组合管理公司中得到日常使用。 均值-方差优化的主要缺点是,理论处理需要了解资产的预期收益和未来风险特征(协方差)。显然,如果我们知道股票的预期收益,生活会容易得多,但整个游戏的关键是股票收益是出了名的难以预测。作为替代,我们可以基于历史数据得出预期收益和协方差的估计 - 尽管我们失去了Markowitz提供的理论保证,但我们的估计越接近真实值,我们的投资组合就会越好。
因此,本项目提供了四个主要功能集(当然它们是密切相关的)
- 预期收益的估计
- 风险估计(即资产收益的协方差)
- 待优化的目标函数
- 优化器
PyPortfolioOpt的一个关键设计目标是模块化 - 用户应该能够在仍然利用PyPortfolioOpt提供的框架的同时交换他们的组件。
特性
在本节中,我们详细介绍了PyPortfolioOpt的一些可用功能。更多示例可以在这里的Jupyter笔记本中找到。另一个好资源是测试。
在ReadTheDocs上可以找到更全面的版本,以及针对更高级用户的可能扩展。
预期收益
- 平均历史收益:
- 最简单和最常见的方法,它认为每个资产的预期收益等于其历史收益的平均值。
- 易于理解和非常直观
- 指数加权平均历史收益:
- 类似于平均历史收益,但它对最近的价格给予指数级更多的权重
- 在估计未来收益时,资产最近的收益可能比10年前的收益更有权重。
- 资本资产定价模型(CAPM):
- 一个基于市场贝塔系数预测收益的简单模型
- 这在金融领域广泛使用!
风险模型(协方差)
协方差矩阵不仅编码了资产的波动性,还编码了它与其他资产的相关性。这很重要,因为为了获得分散化的好处(从而增加每单位风险的回报),投资组合中的资产应该尽可能不相关。
- 样本协方差矩阵:
- 协方差矩阵的无偏估计
- 计算相对容易
- 多年来的事实标准
- 然而,它有较高的估计误差,这在均值-方差优化中特别危险,因为优化器可能会对这些错误估计给予过多权重。
- 半协方差:一种专注于下行变动的风险衡量指标。
- 指数协方差:对样本协方差的改进,给予最近数据更多权重
- 协方差收缩:涉及将样本协方差矩阵与结构化估计器结合的技术,以减少错误权重的影响。PyPortfolioOpt提供了围绕
sklearn.covariance
提供的高效向量化实现的包装器。- 手动收缩
- Ledoit Wolf收缩,选择最优收缩参数。我们提供三个收缩目标:
constant_variance
、single_factor
和constant_correlation
。 - Oracle近似收缩
- 最小协方差行列式:
- 协方差的稳健估计
- 在
sklearn.covariance
中实现
(此图是使用plotting.plot_covariance
生成的)
目标函数
- 最大夏普比率:这会产生一个_切线投资组合_,因为在收益vs风险图上,这个投资组合对应于有效前沿的切线,其y轴截距等于无风险利率。这是默认选项,因为它找到了每单位风险的最优回报。
- 最小波动率。如果你想了解波动率_可能_有多低,这可能很有用,但在实践中,使用最大化夏普比率的投资组合对我来说更有意义。
- 有效收益,又称Markowitz投资组合,它在给定目标收益的情况下最小化风险 - 这是Markowitz 1952年的主要关注点
- 有效风险:给定目标风险的夏普最大化投资组合。
- 最大二次效用。您可以提供自己的风险厌恶水平并计算适当的投资组合。
添加约束或不同目标
- 多头/空头:默认情况下,PyPortfolioOpt中的所有均值-方差优化方法都是仅多头的,但可以通过更改权重界限来允许空头头寸:
ef = EfficientFrontier(mu, S, weight_bounds=(-1, 1))
- 市场中性:对于
efficient_risk
和efficient_return
方法,PyPortfolioOpt提供了形成市场中性投资组合的选项(即权重之和为零)。这对于最大夏普投资组合和最小波动率投资组合是不可能的,因为在这些情况下,它们对杠杆不变。市场中性需要负权重:
ef = EfficientFrontier(mu, S, weight_bounds=(-1, 1))
ef.efficient_return(target_return=0.2, market_neutral=True)
- 最小/最大头寸规模:可能你希望没有证券占你投资组合的10%以上。这很容易编码:
ef = EfficientFrontier(mu, S, weight_bounds=(0, 0.1))
均值-方差优化的一个问题是它会导致许多零权重。虽然这些在样本内是"最优的",但有大量研究表明,这一特征导致均值-方差投资组合在样本外表现不佳。为此,我引入了一个目标函数,可以减少任何目标函数的可忽略权重的数量。本质上,它对小权重添加了一个惩罚(由gamma
参数化),其形式看起来就像机器学习中的L2正则化。可能需要尝试几个gamma
值来达到所需的非可忽略权重数量。对于20只证券的测试投资组合,gamma ~ 1
就足够了
ef = EfficientFrontier(mu, S)
ef.add_objective(objective_functions.L2_reg, gamma=1)
ef.max_sharpe()
Black-Litterman分配
从v0.5.0版本开始,我们现在支持Black-Litterman资产配置,它允许您将先验收益估计(例如市场隐含收益)与您自己的观点相结合,形成后验估计。这比仅使用历史平均收益能得到更好的预期收益估计。查看文档了解理论讨论以及输入格式的建议。
S = risk_models.sample_cov(df)
viewdict = {"AAPL": 0.20, "BBY": -0.30, "BAC": 0, "SBUX": -0.2, "T": 0.131321}
bl = BlackLittermanModel(S, pi="equal", absolute_views=viewdict, omega="default")
rets = bl.bl_returns()
ef = EfficientFrontier(rets, S)
ef.max_sharpe()
其他优化器
上述功能主要涉及通过二次规划解决均值-方差优化问题(尽管这由cvxpy
处理)。然而,我们还提供了不同的优化器:
- 均值-半方差优化
- 均值-CVaR优化
- 分层风险平价,使用聚类算法选择不相关资产
- Markowitz的临界线算法(CLA)
更多详情请参阅文档。
相较于现有实现的优势
- 包括经典方法(Markowitz 1952和Black-Litterman)、建议的最佳实践(如协方差收缩),以及许多近期发展和新颖特性,如L2正则化、收缩协方差、分层风险平价。
- 原生支持pandas数据框:轻松输入您的日常价格数据。
- 广泛的实际测试,使用真实生活数据。
- 易于与您的专有策略和模型结合。
- 对缺失数据和不同长度的价格序列具有鲁棒性(例如,FB数据仅追溯到2012年,而AAPL数据可追溯到1980年)。
项目原则和设计决策
- 应该易于用户自己的专有改进替换优化过程的各个组件。
- 可用性至关重要:宁可自解释也不要一致性。
- 除非能实际应用于真实资产价格,否则投资组合优化毫无意义。
- 所有已实现的内容都应该经过测试。
- 内联文档很好:专门(单独)的文档更好。两者并不互相排斥。
- 格式永远不应妨碍编码:因此,我将所有格式决策交给了Black。
测试
测试使用pytest编写(在我看来比unittest
及其变体更直观),我尽力确保接近100%的覆盖率。通过导航到包目录并在命令行上简单运行pytest
来运行测试。
PyPortfolioOpt提供了20支股票的每日收益测试数据集:
['GOOG', 'AAPL', 'FB', 'BABA', 'AMZN', 'GE', 'AMD', 'WMT', 'BAC', 'GM',
'T', 'UAA', 'SHLD', 'XOM', 'RRC', 'BBY', 'MA', 'PFE', 'JPM', 'SBUX']
这些股票经非正式选择,以满足几个标准:
- 合理的流动性
- 不同的表现和波动性
- 不同数量的数据以测试鲁棒性
目前,测试尚未探索所有边缘情况以及目标函数和参数的组合。然而,每种方法和参数都已经过测试,确保按预期工作。
引用PyPortfolioOpt
如果您在已发表的工作中使用PyPortfolioOpt,请引用JOSS论文。
引用字符串:
Martin, R. A., (2021). PyPortfolioOpt: portfolio optimization in Python. Journal of Open Source Software, 6(61), 3066, https://doi.org/10.21105/joss.03066
BibTex:
@article{Martin2021,
doi = {10.21105/joss.03066},
url = {https://doi.org/10.21105/joss.03066},
year = {2021},
publisher = {The Open Journal},
volume = {6},
number = {61},
pages = {3066},
author = {Robert Andrew Martin},
title = {PyPortfolioOpt: portfolio optimization in Python},
journal = {Journal of Open Source Software}
}
贡献
欢迎贡献。请查看贡献指南了解更多信息。
我要感谢自2018年发布以来为PyPortfolioOpt做出贡献的所有人。 特别感谢:
- Tuan Tran(现在是主要维护者!)
- Philipp Schiele
- Carl Peasnell
- Felipe Schneider
- Dingyuan Wang
- Pat Newell
- Aditya Bhutra
- Thomas Schmelzer
- Rich Caputo
- Nicolas Knudde
联系方式
如果您在使用PyPortfolioOpt时遇到问题,请在GitHub上提出issue。对于其他任何事情,您可以通过以下方式联系我: