博客

【求职分享】

【笔试/面试】

Two Sigma 如何使用深度学习处理量化投资中的序列?

Jan 30,2023

分享本文:

【概要】Two Sigma的名称代表了Sigma一词的两种不同含义。小写的Sigma“σ”代表着一项投资的波动性,而大写的Sigma“Σ”是求和的意思。

介绍

 

量化投资对许多人来说似乎很陌生——以导致观察者经常将投资过程本身称为“黑匣子”。此外,量化投资的复杂性不断增加,如今,Two Sigma 和其他公司经常在流程的各个部分采用强大的深度学习技术,以根据海量数据做出决策。

 

Two Sigma Investment成立于2001年,创始人是David Siegel,John Overdeck和Mark Pickard(已退休)。其中,David Siegel和John Overdeck均为德邵基金(D.E. Shaw)前员工。

 

 

Two Sigma是什么来头?

 

 

Two Sigma的名称代表了Sigma一词的两种不同含义。小写的Sigma“σ”代表着一项投资的波动性和超额回报,而大写的Sigma“Σ”是求和的意思。

 

Two Sigma认为,自己并非典型的投资机构,而是同时遵循技术创新原则和投资管理原则的一家公司。自创始之日起,Two Sigma就强调机器学习和分布式运算的运用,而基金内部的人员构成也凸显出对技术的重视。

 

在Two Sigma,72%的员工没有金融背景。大部分员工是从麻省理工学院、卡耐基-梅隆大学以及加州理工学院等院校的计算机科学、数学和工程毕业生中直接选聘的。超过1200名员工中,三分之二在从事研发工作。

 

在公司官网上,Two Sigma这样给自己下了定义:“超过1200人相信科学方法是好的投资方式。用信息支撑理念。用重复试验来优化。这就是Two Sigma。”

 

 

如何使用深度学习?

 

 

即便这些有名的公司都纷纷表示自己使用了强大的深度学习技术,但这个过程并不一定像有时被认为的那么奇特。

 

Two Sigma 的 David Kriegman ,同时加州大学圣地亚哥分校的计算机科学与工程的教授,近期主持了一场网络研讨会,以阐明 Two Sigma 研究人员如何将深度学习应用于量化投资中的序列。

 

Link: https://www.twosigma.com/articles/webinar-deep-learning-for-sequences-in-quantitative-finance/

 

Kriegman简单明了得说明,该过程可以被很自然地分解为特征提取、预测单个金融工具回报、投资组合分配以及交易执行。此过程中的步骤大部分很容易表示为机器学习问题,可以使用深度学习序列方法解决。

 

图片

 

在网络研讨会中,首先介绍了Two Sigma量化投资的工作流程,以及各部分与深度学习之间的联系;第二部分介绍了一些常见的用于序列预测的深度学习模型。

 

图片

 

一个传统的要素投资框架主要有以下几个步骤:

 

  • 特征提取

  • 阿尔法建模

  • 投资组合优化

  • 执行

 

我们从数据进入 特征提取器(Feature Extraction)开始, 被提取成特征因子,再进行Alpha建模。

 

图片

 

在特征提取和 Alpha 建模中,因子的原始输入可以来自一系列不同的来源,例如技术特征、基本数据、情绪数据以及一些其他的替代数据。从大量数据中构建 Alpha 模型,通过顺序深度学习来预测每个单独资产类别的未来回报。所有这些问题都可以表示为一个大规模的优化问题。

 

图片

 

在对每个单独的资产进行收益预测后,下一步是构建投资组合。定量研究人员需要确定投资组合中每项资产的分配。虽然它不是一个顺序预测问题,但在投资组合优化中可以实现很多机器学习算法,因为问题其实就是一个优化问题,只是需要考虑很多约束,以及选择合适的目标函数。

 

图片

然后,在执行层面,预测未来价格以控制成本也很关键。与更关注相对长期回报的特征提取和 alpha 建模不同,执行策略的预测更倾向于关注短期价格动态并处理买入和卖出合适的数量,也就是做超短线。

 

在策略之后, David Kriegman给大家介绍了以下的模型:循环网络 (RNN),长短期记忆 (LSTM),注意力模型(attention)和Transformer。

 

 

 

演讲还简要介绍了强化学习的一些应用,它在游戏和机器人领域取得了成功,但现在判断它在量化金融领域的强大程度还为时过早。

 

图片

 

 

总结

 

 

综上所述,我们可以看到在Two Sigma等对冲基金中:

 

  1. 投资模型的许多部分都需要对序列进行推理,因此可以训练深度网络来提供帮助,深度学习是有很多应用场景的

  2. 保持传统投资框架并确定实施深度学习模型的领域很重要

  3. 软件基础设施(如分布式系统)和大量数据同样重要

 

感谢对我们的关注,将为大家带来更多量化投资的内容。

 

写一篇评论

发表评论
%{tishi_zhanwei}%
博客留言测试

Dec 20,2022

< 1 >