Project Icon

alphagen

强化学习驱动的自动化 Alpha 因子生成框架

AlphaGen 是一个基于强化学习的自动化 Alpha 因子生成框架。该项目提供内置 Alpha 计算管道和外部接口,支持 PPO 算法训练。AlphaGen 还实现了基于遗传规划和深度符号回归的基准方法,以及实验性交易策略。这一工具旨在为量化投资研究和实践提供 Alpha 因子自动生成和优化的解决方案。

AlphaGen

使用强化学习自动生成公式化alpha。

论文《通过强化学习生成协同公式化Alpha集合》已被KDD 2023接收,应用数据科学(ADS)方向。

论文可在ACM数字图书馆arXiv上获取。

如何复现?

请注意,您可以选择使用我们内置的alpha计算流程(见选项1),或实现适配器以连接您自己的流程(见选项2)。

选项1:股票数据准备

内置流程需要Qlib库和本地存储的股票数据。

  • 请务必阅读!我们需要Qlib提供的部分元数据(但不包括实际的股票价格/交易量数据),因此请先按照Qlib的数据准备流程进行操作。
  • 我们使用的实际股票数据来自baostock,这是出于对Qlib使用的数据源的时效性和真实性的考虑。
  • 可以通过运行脚本data_collection/fetch_baostock_data.py来下载数据。默认情况下,新下载的数据保存在~/.qlib/qlib_data/cn_data_baostock_fwdadj中。可以根据具体需求自定义此路径,但请确保在加载数据时使用正确的路径(在alphagen_qlib/stock_data.py中,函数StockData._init_qlib中,应将路径传递给qlib,使用qlib.init(provider_uri=path))。

选项2:适配外部流程

如果您有更好的alpha计算实现,可以实现alphagen.data.calculator.AlphaCalculator的适配器。接口定义如下:

class AlphaCalculator(metaclass=ABCMeta):
    @abstractmethod
    def calc_single_IC_ret(self, expr: Expression) -> float:
        '计算单个alpha与预定义目标之间的IC。'

    @abstractmethod
    def calc_single_rIC_ret(self, expr: Expression) -> float:
        '计算单个alpha与预定义目标之间的Rank IC。'

    @abstractmethod
    def calc_single_all_ret(self, expr: Expression) -> Tuple[float, float]:
        '计算单个alpha与预定义目标之间的IC和Rank IC。'

    @abstractmethod
    def calc_mutual_IC(self, expr1: Expression, expr2: Expression) -> float:
        '计算两个alpha之间的IC。'

    @abstractmethod
    def calc_pool_IC_ret(self, exprs: List[Expression], weights: List[float]) -> float:
        '首先线性组合alpha,'
        '然后计算该线性组合与预定义目标之间的IC。'

    @abstractmethod
    def calc_pool_rIC_ret(self, exprs: List[Expression], weights: List[float]) -> float:
        '首先线性组合alpha,'
        '然后计算该线性组合与预定义目标之间的Rank IC。'

    @abstractmethod
    def calc_pool_all_ret(self, exprs: List[Expression], weights: List[float]) -> Tuple[float, float]:
        '首先线性组合alpha,'
        '然后计算该线性组合与预定义目标之间的IC和Rank IC。'

提醒:不同alpha评估的值可能有显著不同的尺度,我们建议在组合前对它们进行归一化。

运行前

我们实验的所有主要组件都位于train_maskable_ppo.py中。

以下参数可能有助于您构建AlphaCalculator

  • instruments(股票代码集合)
  • start_time和end_time(每个数据集的数据范围)
  • target(目标股票趋势,例如20天收益率)

以下参数将定义一次强化学习运行:

  • batch_size(PPO批量大小)
  • features_extractor_kwargs(LSTM共享网络的参数)
  • device(PyTorch设备)
  • save_path(检查点保存路径)
  • tensorboard_log(TensorBoard日志路径)

运行!

python train_maskable_ppo.py --seed=种子 --pool=池容量 --code=股票代码 --step=步数

其中,种子是随机种子,例如11,2池容量是组合模型的大小,步数是强化学习步骤的限制。

运行后

  • 模型检查点和alpha池位于save_path
  • Tensorboard日志位于tensorboard_log

基准方法

基于GP的方法

gplearn实现了遗传规划,这是符号回归常用的方法。我们维护了gplearn的修改版本,使其与我们的任务兼容。相应的实验脚本是gp.py

深度符号回归

DSO是一个成熟的深度学习框架,用于符号优化任务。我们维护了DSO的最小版本,使其与我们的任务兼容。相应的实验脚本是dso.py

仓库结构

  • /alphagen包含了启动alpha挖掘流程的基本数据结构和核心模块;
  • /alphagen_qlib包含了用于数据准备的qlib特定API;
  • /alphagen_generic包含了为我们的基准方法设计的数据结构和工具,基本上遵循gplearn的API,但针对量化流程进行了修改;
  • /gplearn/dso包含了我们基准方法的修改版本。

交易(实验性)

我们基于Qlib实现了一些交易策略。请参阅backtest.pytrade_decision.py获取演示。

引用我们的工作

@inproceedings{alphagen,
    author = {Yu, Shuo and Xue, Hongyan and Ao, Xiang and Pan, Feiyang and He, Jia and Tu, Dandan and He, Qing},
    title = {Generating Synergistic Formulaic Alpha Collections via Reinforcement Learning},
    year = {2023},
    doi = {10.1145/3580305.3599831},
    booktitle = {Proceedings of the 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining},
}

贡献

欢迎提交问题或拉取请求。

贡献者

本工作由中国科学院计算技术研究所智能信息处理实验室的MLDM研究组维护。

维护者包括:

感谢以下贡献者:

感谢以下对我们项目进行深入研究的人:

  • 因子选股系列之九十五:DFQ强化学习因子组合挖掘系统
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号