博客

【求职分享】

【笔试/面试】

机器学习: AI 在量化投资是如何应用的?

Feb 03,2023

分享本文:

【概要】比如价格、交易量这种市场数据,或者说是来自财务报表、分析师研报的基本面数据,甚至是新闻社交媒体这种体现交易者情绪的非结构化数据。

大家好, 我是Lucy@FinTech社区。今天这篇文章是关于AI在量化投资中是如何应用的。欢迎大家扫描二维码,加入FinTech社区,提认知,攒人脉,求职招聘!

图片

 

本文授权总结自斯坦福创新论坛线上活动(https://www.bilibili.com/video/BV1rk4y1274T) Metabit Trading 的演讲。

 

首先我们来看这张图:

 

图片

 

它和标准的机器学习任务是比较类似的。当我们有了raw data,然后要进行feature engineering,知道feature之后,进入到machine learning model产生一个prediction。从前半部分raw data到prediction这一步,总共有两个不太一样的地方。

 

第一个不同是:training的raw data可以是任何数据。

 

比如价格、交易量这种市场数据,或者说是来自财务报表、分析师研报的基本面数据,甚至是新闻社交媒体这种体现交易者情绪的非结构化数据。

 

这方面有大量的数据清洗工作要做,并且他们必须是自动化完成的。所以像互联网行业,你可以把很多这种标签来外包来完成,但是这块必须要自动清洗,并且清洗的效果越好的话,最终体现的的盈利越多。

 

第二个不同的是:machine learning,model这一步的信噪比特别特别低。

 

你会发现所有你熟知的machine learning model针对的都是这样信噪比为1的情况。所以我们需要对模型底层算法进行一个特性的改进,来针对性地研究一个问题。

 

那下一步,我们有了prediction,该怎么把这个信号变成仓位呢?我们称它为portfolio construction 。这一步也非常重要,有两个原因。

 

第一个原因是每个股票之间是有correlation的。你可以想象说两个股票走势很像,它们的权重之和你不希望太大,或者两个股市的走势很独立很不像,你可能倾向它们是平均分配,俗称“鸡蛋不能放在一个篮子里”。

 

所以我们要分析correlation的结构,科学利用这个结构是可以降低风险的。

 

第二点很重要的原因是我们在做portfolioconstruction的时候,要考虑每次做决策股票权重和你上一次给出的权重差异不能太大。

 

因为差异越大就意味着你买卖进出的操作就越多。操作是有成本的,所以把交易成本的最小化考虑在其中,也是portfolio construction很重要的一项。这一块主要用到的数学工具是optimization和multi-period decision making。

 

因为数据量非常有限,不像做强化学习(reinforcement learning)有大量的simulation来产生数据。在这么小的数据量的情况下,你怎么能有一些知识结构的结构化模型能够把它学好?(需要深入学习)

 

最后有了仓位,就要考虑发出订单了。我们会用一些随机过程,优化的一些工具来模拟和市场的互动来下单。

 

说完了这一整个流程,我们来看看AI在不同频率上的不同侧重点。我这里分为了高中低三个频率:

 

图片

 

对于高频来说,大家可能经常听到high frequency trading,抢的就是速度。持仓时间、决策时间就是微秒甚至纳秒到分钟级别的,交易快就非常非常重要。所以有一个好的交易系统,也就是 trading infrastructure特别重要!

 

因为速度快,所以需要的模型就非常简单,跟不上的话什么都白搭。它叫做高频交易, 这个特点就会让它更像是一个硬件设计公司,很硬核。

 

而且一般来说都是做自营交易,也就是用自己的钱交易。因为市场上太小了,可能就几个亿,也不需要募资。

 

中频领域,速度要求没那么高了,那么我们终于可以上大规模运算量的这种特别复杂的模型了。

 

此时算法就变成得特别重要。而且这么复杂的算法,它对于research infrastructure的需求就很大,并且数据量相比高频就小很多。

 

所以过拟合就成了一个很大的问题。它是算法的第一位重要的一个特性。所以它更像一个算法科技公司,算法是核心。

 

并且中频策略一般也是自营,因为它兼具收益稳定和容量大的一个平衡。而我们公司最擅长的其实也是中频和高频,因为他们也是machine learning能利用的比较多的地方。

 

对于低频而言,因为它时间特别长,时间长了以后买卖操作就可以慢慢来,所以容量就变得非常非常大,容量大了对资金的需求就很大。因此,募资就是编程低频策略的重中之重了。

 

但另一方面,持仓时间长,容量大,坏处就是样本点太少,所以需要非常严谨的统计分析。总体来讲低频策略擅长的公司往往是资产管理公司,他有很强的金融属性。

 

从盈利的角度来给大家一个直观的感觉:

 

  • 高频策略,基本上大概率是每天都在赚钱的。

  • 中频策略,大概一周或者一个月也可能是赚钱的

  • 低频策略,一年一年来看,是以年为单位赚钱的。

 

最后,关于AI 在量化投资是如何应用,大家有其他问题想了解的话,可以添加微信:fintech78,加入FinTech 社区的机器学习小组一起讨论交流。 

写一篇评论

发表评论
%{tishi_zhanwei}%
博客留言测试

Dec 20,2022

< 1 >