1. 多因子策略简介
多因子策略是一种应用十分广泛的选股策略,其基本思构想就是找到某些和收益率最相关的指标,并根据该指标,建一个股票组合,期望该组合在未来的一段时间跑赢或者跑赚取输指数。如果跑赢,则可以做多该组合,同时做空期指,如果是跑输,则可以做多期指,融券做空该正向阿尔法收益组合,赚取反向阿尔法收益。多因子模型的关键是找到因子与收益率之间的关联性。
2. 因子选取:
本文作为一个入门版,为了代码简洁明了,只选取了一个盈利因子(roic 投资回报率)和两个估值因子(PS 市销率/PB 市净率)进行回测。
3. 数据预处理
数据预处理主要分为两步:
a. 极值标准化:
在处理金融事件序列的数据时,经常性会遇到极值的情况存在,极值会影响数据的适用程度。极值标准化即是通过将属性数据按照比例缩放,使之落入一个小的特定区间,如[-1,+1]、[0,1]等,以进一步分析数据的属性。本文采用中位数去极值法,其公式如下:
b. 无量纲处理:
由于各因子所衡量的单位不同,导致因子范围差异较大,因此在进行因子分析之前,必须对其进行无量纲处理以实现标准化,本文采用最常用的正态标准化处理方法,公式如下:标准化后向量 = (原向量 – 均值)/标准差
4. 其他设置
缺省值处理:得分为0
计算综合因子(得分):因子标准化后等权重求和(注意因子方向)
调仓频率:每月调仓一次
股票池设定:沪深300(可使用智能选股函数灵活设置)