上一节中我们学习了如何通过单因子策略进行股票交易,在实际的股市中,因子(也就是指标)数量往往非常之多,比如市盈率/市净率/净资产收益率等,在使用这些因子的过程中,我们会发现有的因子与收益率为正相关,有的因子为负相关,而有些因子几乎完全无关。
所以我们可以通过计算不同因子与收益率的相关系数,得到可以指导我们进行操作的因子。相关系数最大值为1,当相关系数大于0.5时,就可以认为该指标是有效指标,当相关系数小于-0.5时,就可以认为该指标是反向指标,当相关系数接近0的时候,该指标就是无效指标,这个就是基于IC值的多因子计算方法的通俗解释。
基于IC值的多因子计算方法
因子IC法来自于多因子模型的打分法,指的是选用若干能够对股票未来时间段收益产生预测作用的因子,根据每个因子在对应位置的状况给出股票在该位置上的得分,然后按照一定的权重将各个因子的得分相加,从而得到该股票各个因子的最终得分。
因此在打分模型中,各个因子的权重设定和计算非常重要,即使是非常好的因子,在权重配置下也可能会有不好的结果。
IC的计算公式如下:
从公式中可以看到,IC的计算公式实际上就是不同序列的相关系数的计算,那么IC值的计算用一句话解释就是:“IC值为因子与对应的下个周期收益率之间的相关系数“。python中的Numpy工具包提供了非常方便的计算方法,即corrcoef函数:
corr = np.corrcoef() #计算相关系数
假设不同股票在某个时间段对应的因子值和下期的收益率如下表所示:
因子A | 因子B | 下期收益率 | |
---|---|---|---|
股票a | 6 | 2 | 0.02 |
股票b | 1 | 4 | 0.004 |
股票c | 2 | 8 | 0.005 |
股票d | 7 | 9 | 0.007 |
我们可以计算不同因子对收益率影响的系数大小(即IC值)
import numpy as np
factor_A = [6,1,2,7]
factor_B = [2,4,8,9]
return_profit = [0.02,0.004,0.005,0.007]
coef_matrix_A = np.corrcoef(factor_A,return_profit) #求factor_A 和 return_matrix 之间的相关系数
coef_matrix_B = np.corrcoef(factor_B,return_profit) #求factor_B 和 return_matrix 之间的相关系数
coef_A = coef_matrix_A[0, 1] #提取第0行,第1列的数值,即相关系数
coef_B = coef_matrix_B[0, 1] #提取第0行,第1列的数值,即相关系数
print(coef_A,coef_B)
运行结果如下: