本文内容非常长,作者花了两个月整理而成,需耐心阅读。
内容可能有错误不足之处,以理解思路,逻辑为重点。
******
正文
质量,价值,低波
质量,低波,价值
质量,低波,价值是目前为止实证年化复合收益率最高的因子。
因子投资【factorinvesting】
因子定义:
“穿透”资产,探寻资产背后“因子”的逻辑。寻找能够解释并且影响资产风险和收益的那些“特征”。
类似众多食物中主要成分蛋白质、脂肪和碳水化合物,维生素C等。
因子描述了众多资产共同暴露的某种系统风险,是资产收益率背后驱动力,因子收益正是该系统风险风险溢价或风险补偿,人认识各种偏差以及套利限制。
因子的背后逻辑:人性的弱点,认识的局限性,风险厌恶的风险补尝。
****
因子的选择必须有深刻逻辑支撑,必须能被'风险补偿','错误定价'两方面得到解释。
技术类因子
动量因子:
背后逻辑:个人投资者更倾向于卖出已盈利投资来锁定收益,并且持有已亏损投资希望其反弹。这使得过去表现较好的股票被低估,过去表现较差的股票被高估。机构投资者作为套利者由于受到做空限制,更倾向于买入过去表现较好的股票进行套利,从而使得强者恒强的效应愈发明显。
因子构成:
强者恒强弱者恒弱,使用过去12个月(剔除最近1个月)收益,获取动量溢价。过去两年(扣除最近1个月)的对数收益率的加权平均。
动量因子:从历史来看一直是A股上有效的投资策略,即买入前期的涨幅大的“赢家”,卖出前期跌幅大的“输家”,是经典的市场异象。
***
BETA因子:
股票收益率与市场因子收益率构建CAPM后的回归系数,即股票对于市场风险溢价的补偿,在A股历史上表现最为显著的风险因子。宏观角度,这主要得益于中国经济与资本市场的快速发展,与市场所关联的企业均获得良好的溢价从而形成较好的表现;从微观而言,高BETA公司承担更多由市场带来的波动,因此需要给予投资者更高的溢价。
流动性因子:
流动性因子(英文名称为Liquidity),但实际上衡量股票的换手率。从该因子收益率的表现来看,高流动性的股票持续获得折价,相反低换手率的股票相对于高流动则持续获得溢价。从理论上而言,换手率低的因子承担较高的流动性风险,因此理应承担更高的风险溢价,但是从实际的投资策略而言,交易流动性低的股票常常伴随产生较大的市场冲击成本,因此很难通过高配低换手率的股票获得超额收益。1/3近21交易日+1/3近63交易日+1/3近252交易日平均换手率的自然对数。
规模因子:ln(流通市值)。
非线性规模因子:非线性规模因子是规模因子的3次方,然后经过施密特正交化处理,以去掉共线性的部分,非线性规模因子主要强调市值中等的股票。
**
波动因子(BAB):
波动因子,也称赌贝塔因子,定义为低贝塔股票-高贝塔股票所构成的多空组合。
背后逻辑:由于投资者常常受到杠杆限制,不能自由增加杠杆,因此,他们更偏好买入高贝塔股票来变相给市场组合增加杠杆。这种行为使得高贝塔股票的价格被高估,由于套利者的存在,导致了更低的平均收益。
波动率(全称为残差波动率,英文名称为ResidualVolatility)由股价的波动率与CAPM的残差性合成而得。从历史来看残差波动率因子折价显著,这表明投资者对于波动与不确定性的厌恶。反过来理解,就是基于低波动股票更高的溢价,表明投资者对于信息确定性的需求。
最小波动率指数:
该指数主要依据最小方差优化法来构建,用来捕捉低波动股票组合带来的超额收益。历史数据显示,它在弱宏观环境下有更好表现,属于防御大类指数。
残差波动率因子计算方法:计算beta因子时的残差序列的标准差。
反转因子:最近一月收益率。
市场因子(MKT):
背后的逻辑是股票相对于短期国库券拥有正溢价。
是股票-短期国库券所构成的多空组合,是人们发现的第一个因子。
市值因子:
背后的逻辑:小市值股票所隐含的经营风险大于大市值股票经营风险导致了持有小市值股票的人需要更高的风险补偿风险溢价。
规模小的公司长期明显跑赢规模大的公司,用市值等指标衡量公司规模,可以获得小市值溢价。
市值因子被公认为对组合影响最为显著的风险因子,通常来说,量化投资者通常以控制行业暴露与市值暴露为风险控制第一原则,目的就是为了防止风格切换导致组合的超额收益下坠。简单来说,市值因子就是同时买入大市值股票与卖出小市值股票构建的理论组合。
基本面因子
价值因子:
上市公司账面/市值的比值,与盈利因子表现相似,在2015年股灾之前,低估值股票产生相较于高估值股票产生折价。究其原因,估值低的股票同时隐含了成长低的假设,而在中国的投资环境中,投资者更愿意给予成长性溢价。
背后逻辑是低估值股票在宏观经济较差时隐含的风险远高于高估值股票,但在宏观经济较好时隐含的风险仅仅略高于高估值股票。因此,总体来看,低估值股票隐含的风险较大,需要更高的风险补偿。
由于低估值股票所对应的上市公司通常拥有较多的非生产性资本(例如固定资产)。非生产性资本在宏观经济较差时会成为企业的负担;而在经济较好时,由于资本扩张较为容易,这种非生产性资本转换为生产性资本带来的优势也有限。
由于便宜的股票长期强于高估的股票,利用PB、PE和EBITDA/EV等估值指标,捕获价值溢价。
P/E高的就是贵价股(往往被市场预期为高成长性)P/E低的就是价值股。
价值因子哪个估值指标最好
价值因子的每个估值指标收益比较:
成长股(组1)的年化收益率为7.67%,而价值股(组10)的年化收益率为14.78%,
成长股(即高估值股票)中,不管用什么估值指标,其年化收益均低于同期市场的平均回报。
在价值股(即低估值股票),除了盈余净率,年化收益率均大幅高于市场平均回报。
如上图:
企业收益倍数(EBITDA/TEV)效果最好,该指标产生了15.83%的最高年化收益率,比市场平均回报高出4.33%。
企业价值倍数(EV/EBITDA)介绍:它反映了投资资本的市场价值和未来一年企业收益间的比例关系。公司价值EV=市值+总负债-总现金=市值+净负债
EBITDA=净利润+所得税+利息+折旧+摊销
EBIT=经营利润+投资收益+营业外收入-营业外支出+以前年度损益调整(或=净利润+所得税+利息)
部分内容选自公众号《量化云QuantCloud》
价值因子在A股长期有效从2008年到2019年6月18日,A股各因子的累计表现。价值因子(Value),显示了很强的收益率,这个收益率主要来自做多低估值股票,做空高估值股票。我们看到价值因子的收益率非常稳定,从2008年至今获得了100%的收益,而且回撤很小。从相对收益的角度看,这个收益率曲线体现了低估值股票在过去10年远远跑赢高估值股票,有很强的相对收益。
长期有效原因:过去10年因子表现的研究中,看到价值因子不但是最有效的,而且回撤也较小,那么我们要思考,这个策略未来还会有效吗?我的答案是依然会有效,主要有两个原因。第一,A股市场仍然是散户主导,导致市场波动较大,容易发生错误定价;第二,宏观经济和产业政策的预期变化比较大。
价值因子风险:从2017年开始至今(2019-8月),价值因子并不是特别有效。事实上,2019年以来,没有任何一个因子跑出Alpha。今年是少数个股的独立行情,以核心资产为代表。
目前(2019年6月18日)价值因子状态:无论是从中证800还是中证1000的成分股来看,PB估值明显是左偏的,PB小于1的股票数量已经很多,而PB高估的股票数量很少。这说明目前阶段大部分股票的估值都比较低。
约翰涅夫管理温莎基金“买入低估值的股票'策略:1964年开始,一直到1995年他64岁的时候退休。期间,温莎基金的年化回报率13.7%,年化超出基准3.5%(扣除费用后超出基准年化3.15%)
涅夫总回报比例(TotalReturnRatio)公式:涅夫寻找那些TRR比例超过市场2倍的股票。比如标普500的TRR比例是0.7,他就会找1.4倍TRR的股票。
比如一个公司的盈利增速12%,分红率2%,市盈率10倍。这家公司的TRR就是12+2/10=1.4倍。
涅夫会寻找那些持续盈利增长,但并不是很快的公司。典型的公司盈利和收入五年增速在7%到25%之间,低于7%增速太慢了,高于25%往往要付出过高的估值。
杠杆因子:
衡量企业的财务杠杆。基于不同的宏观、利率与公司自身的财务健康状况,投资者对于杠杆因子在不同的宏观背景下产生差异较大的预期。个人而言,杠杆因子并不是特别好的风险因子。
成长因子:
成长因子:1/3每股营收同比增速+1/3每股收益同比增速+1/3一致预期净利润增速。每股营收同比增速:最近报告期比上一年度同类报告期营业收入;每股收益同比增速:最近报告期比上一年度同类报告期eps;一致预期净利润增速:wind一致预期。
盈利因子:反映上市公司的盈利能力,通过上市公司的每股净利润构建所得。盈利因子在2015年之前表现平淡,但是在2015年股灾之后,盈利因子出现显著的反转,这是也是投资者在经历市场教训之后,对于企业盈利确定性的追求。反观海外市场,盈利和盈利质量一直都获得溢价,这种差异的产生主要是市场的主要参与群体所决定。
质量因子:
(仅反映企业静态状态,关心较高的盈利水平)(未反映是否能持续地加速增长。加速的增长往往才是大牛股的关键。)
背后逻辑:一个饱受争议的因子,因为从传统的风险溢价视角看,财务质量较高的公司所面临的运营风险相对较小,投资者不应该从中获取更高的风险补偿。但难以置信的是,质量因子在不同时期,不同规模,不同国家均表现出了稳定的正收益。
以上部分内容摘自:《太平基金》中因子投资:站在巨人的肩膀上。
质量因子拆分为三个维度:盈利能力、成长性和安全性。
基本面好的公司要比基本面差的公司更有优势,从盈利能力、成长能力和财务安全等角度,获取质量溢价。
盈利能力包括毛利率比总资产(grossprofitoverassets,GPOA)、ROE、ROA、现金流比总资产(cashflowoverassets,CFOA)、毛利率(grossmargin)和盈利中现金的占比(即盈利减去应计项目,ACC)这6个指标。
成长性则衡量盈利能力指标的变化率,但不考虑毛利率的变化,但不是直接计算各比率的变化,而是计算分子的五年变化,再除以滞后的分母项进行标准化。
安全性则包括4个指标,包括低beta(BAB)、低杠杆率、低破产概率(O-score)和低ROE波动率。
对于每一维度,首先计算每一指标的横截面排序并用z-score方法标准化,然后计算各指标z-score之和,接着再次标准化,得到该维度的得分。最后,加总三个维度的得分并再次标准化,得到每支股票的质量得分。
巴菲特投资组合因子分析:
巴菲伯克希尔40多年间,年化超额收益高达17.6%.其中,市场因子平均回报6.8%,
质量因子平均回报3.4%,
低分险因子平均回报2.6%,
价值因子平均回报1.2%,
因子无法解释的3.6%。巴菲特投资原则:以低价买入优质股票并长期持有。
对于市场组合,其暴露接近于1对价值和质量因子有着显著的正暴露(分别达0.40和0.47)对BAB(低风险因子)也有着一定正暴露对规模和动量则有着小幅的负暴露,但并不显著。对成长和股息收益率的因子暴露为负。
偏爱高配价值,质量因子,低BAB,低配规模和动量因子,有正的alpha。
巴菲特对廉价高质量低BAB公司的偏爱,而不是高增长的科技公司
模拟投资策略:
“股价低往往有两种原因,一种是公司本身一无是处,价值被市场充分认识,本该这个价格。另一种是公司本身质量很好,价值被市场严重低估,这才是价值投资所需要寻找的投资标的。
第一步:使用估值指标《企业收益倍数(EBITDA/TEV)》选出低估值一组。
第二步:在低估值,价值股一组中利用五个指标,按照等权重组合起来,成为一个综合质量指标,选出高质量公司,便形成了高综合质量的价值股。
第三步:每年7月,换仓,回测
如图:最好的高质量价值股每年年化收益率高17.71%(毛利资产率)。
防止5种质量指标,万一某个出错了,利用五个指标,按照等权重组合起来,成为一个综合质量指标。
回测:高综合质量价值股的年化收益率为17%。与股神的扣除无风险收益之前的年化收益(20%)差距在3%-4%左右。
归因表现:价值投资和质量投资长期优异。
总结:选出物美价廉的并长期持有。
低PB市净率高f-score策略:
在低PB市净率价值公司股票中,选岀高f-score分值最高的股票。
F-Score由九大指标所组成,每个指标可得1分或0分:
ROA=资产回报率;大于0便得1分
ROA=今年的ROA-去年的ROA;大于0便得1分
CFO=营运活动所得的现金流量;大于0便得1分
ACCURAL=当期净利-营运现金流量;大于0便得1分
LEVER=今年的负债比率-去年的负债比率;大于0便得1分
LIQUID=今年的流动比率-去年的流动比率;大于0便得1分
EQ_OFFER=增发股权;今年较去年有增发情况便得0分
MARGIN=今年毛利率-去年的毛利率;大于0便得1分
TURN为=今年资产周转率-去年的资产周转率;大于0便得1分
0-3分:基本面弱
4-6分:基本面适中
7-9分:基本面强
8-9分就是基本面很好的公司
质量因子指数
质量指数:
该指数主要依据ROE、分红盈利比等指标来筛选高质量个股,用来捕捉拥有低负债率和持续盈利的公司带来的超额收益。历史数据显示,它在弱宏观环境下有更好表现,属于防御大类指数。
具体质量指数:
标普A股质量指数:先是用净资产收益率、资产负债应计率、财务杠杆三大质量因子选出打分最高的200只股票,再用市盈率、市净率、市销率等价值因子在其中的200只股票里选出100只。再由自由流通市值乘以质量因子打分加权,行业权重上限为40%,个股权重上限为5%与流通市值占比20倍中取低值,下限为0.05%。指数每半年调整一次,每年6和12月。
罗素1000.BetaPlus1000指数年化收益率为7.24%,年化波动率为27.63%,而它的风格因子指数中质量和价值指数表现最好约13%,而且年化波动率最低,即sharp率也高约0.6。如图:
质量和价值择时:
若质量和价值指数因子通过择时构成组合TAA,则收益率更高13.98%,但波动率更大,sharp率更小。
当1个月均线向上突破6个月均线时,标为上涨市;
当1个月均线向下跌破6个月均线时,标为下跌市。
均线系统存在滞后性,但总体来看符合预期。
在上涨行情中,价值指数的表现优于质量指数;而反观在下跌行情中,质量指数的表现无疑更加亮眼,展现出优秀的防御能力。
当1个月均线上穿6个月均线时,持有价值指数。当1个月均线下穿6个月均线时,持有质量指数。
sharp率:收益指标/风险类指标。越大越好。个人认为也可简单理解为年化收益率/年化波动率。
质量增长因子:(反映是否能持续地加速增长。加速的增长往往才是大牛股的关键。)
背后的驱动因素更多是投资者的注意力缺失,而不对应系统性的风险承担。
纯因子:
纯因子组合对模型中某个因子具有单位暴露度,对其他因子暴露度为0,避免了传统的排序多空组合可能无意识暴露到其它因子上的问题。
了克服共线性,将描述股票同一类性质的多种因子合成大类因子,此处分别为成长、EP、BP、流动性、规模、非线性规模、beta、残差波动率、反转、动量、质量,合成。
纯因子回测:
选取的各风格纯因子组合均能超越基准组合,流动性、规模纯因子、反转因子组合超额收益明显高于其他因子。波动率方面,规模因子最大,成长因子最小。
在控制了风格因子之后,医药、有色、食品饮料和计算机贡献较高超额收益,而钢铁、交运、公用事业和轻工没有超额收益。从波动率可以看出,行业因子收益的轮动更加频繁和难以把握。
大类因子合成:
从子类因子合成为大类因子的方式是:先对各个子类因子值进行极值处理(±5%winsorization),再计算z-score,然后将各子类因子的z-score按表中权重合成为大类因子值,并再一次对合成得到的大类因子值正态标准化,作为最终的因子暴露值。
以上部分内容摘自公众号《长江金工》利用纯因子组合检验因子有效性。
*********
因子周期:
成长、质量和动量在市场上涨、经济扩张和市场乐观时有较好的表现
质量、低波和红利在下跌市场、经济收缩和市场悲观时表现更胜一筹。
各经济周期下不同因子表现如何:
经济周期:
宏观环境分为了四类:经济增长(库兹涅茨周期进行刻画)和流动性(借助朱格拉周期辅助判断)
利用库兹涅茨周期对经济增长进行判定。
利用朱格拉周期、全市场估值水平、国债收益率等诸多信息确定流动性状态。市场的估值水平跟朱格拉周期基本是相反的状态。
2001年4月至2004年12月:经济增长&流动性紧张;
2005年1月至2006年3月:经济增长&流动性宽松;
2006年4月至2007年9月:经济增长&流动性紧张;
2007年10月至2009年6月:经济衰退&流动性宽松
2009年7月至2013年12月:经济衰退&流动性趋紧张;
2014年1月至2016年8月:经济衰退&流动性宽松:
2016年9月至2018年12月:经济增长&流动性紧张:
经济运行逻辑:
在理想环境下,我们认为在经济增长的时期,首先迎来的是流动性紧张,之后流动性将会短暂放松,后期流动性继续趋于紧张,接着经济将从增长转向衰退,同时流动性会迅速转向,进入经济衰退、流动性趋于宽松的阶段,在经济衰退的中期,流动性会短暂趋紧,之后再次趋向放松。最后经济从衰退转向增长,流动性随之转向趋紧,开启新的经济增长轮回。
经济周期与资产价格的逻辑:
当全社会的企业经营活动水平上升、企业盈利增加的时候,企业的信贷需求就会增加,资金从金融资产转向生产流通领域。导致了信贷价格(利率)开始上升,同时生产流通领域的价格也开始上升。利率的上升提高了金融资产的必要回报率,压低了金融资产的价格。同时生产流通领域的价格上升增加了整体价格系统的不稳定,对货币政策和整体的流动性水平形成制约。
当企业盈利开始下降的时候,对信贷的需求就会减少。资金开始从生产流通领域转向金融资产,信贷价格(利率)开始下降,利率的下滑压低了金融资产的必要回报率,资产价格的上升主要表现为估值的扩张。此时,过量的流动性将会大幅提高市场的风险偏好,压低风险溢价水平。
ROE与利率关系:
ROE与一年期国债利率画在一起,可以看到两者有很明显的同上同下的特征。在图中ROE数据似乎有落后于利率数据的现象,这是因为公司的ROE数据只有财报公布的时候才会更新,所以本身就是滞后的。但实际上,我们认为正是因为公司盈利水平的变化才使得利率发生了变化。
CRB综合商品指数反映了全球经济的总需求,因此其可以在一定程度上反映整体经济的趋势。
********
各经济周期下因子表现内在逻辑:
市值因子:小市值因子的表现体现了不同经济周期下投资者偏好的变化。当经济增长的确定性增强,资金将从不确定性更高的小市值股票中流出,选择盈利更为确定的大市值股票。而当经济逐渐走弱,拥有大市值特征的公司盈利变差的确定性也更强,资金将倾向于更有可能盈利的小市值股票,从而回避确定性变差的公司。也就是说,经济增长追求变好的确定性,经济走弱回避变差的确定性。
成长类因子:与流动性也有比较密切的关系。
由于成长类因子指代的是已完成的“成长”,与多数投资者考察的未来的“成长”并不一致。在因子研究的框架下,成长是指过去已经实现的高成长,比如营业收入的增长、净利润的增长和ROE的增长。这种高增长往往具有一定的惯性,因此长期来看成长因子表现较好。同时,具有这种高成长特性的股票大部分是“蓝筹股”。
质量类因子:具有中长周期特征
以ROE作为代表性的质量类因子,过往表现有两个特点,一个是受长周期经济走势的影响十分密切,二是在经济弱势的阶段,朱格拉周期的上行也会带动质量因子有不错的表现。从1998年至今,有三段时期ROE因子表现较好,第一次是2002年10月到2006年11月,第二次是2010年3月到2013年5月,第三次是2016年12月至今。第一次与第三次都发生在库兹涅茨周期明显上升的阶段,也就是实体经济开始了明显的增长,企业盈利增加,投资者的投资风格开始转向大盘价值,对基本面的重视导致ROE因子收益率快速累积。第二次是经济衰退过程中,库兹涅茨周期下行,朱格拉周期上行,出现了阶段性的流动性紧张,这个阶段高ROE的企业受到投资者的青睐,超额收益凸显。
杠杆类因子:本质上更接近风险因子而不是收益因子,当经济向好的时候高杠杆的股票表现要好于低杠杆的股票,当经济相对弱势的时候低杠杆的股票表现要好于高杠杆的股票。这说明,在经济强势期,投资者不排斥高杠杆的股票,较高杠杆的股票反而收益更高;当经济进入弱势期的时候,投资者相对偏好低杠杆的股票,这符合经济强势加杠杆、经济弱势去杠杆的经济学原理。
当经济增长的时候,大市值、价值因子表现较好。
经济衰退的时候小市值、反转、杠杆类因子表现较好。
流动性趋于紧张的时候成长类因子一般都表现较好。
除去经济衰退叠加流动性宽松的时期,其余三种环境下质量类因子表现都可以。
换手率因子和波动率因子在不同的宏观环境下表现都比较好,这两个因子建议长期配置,没有放入投资时钟。
成长因子在因子投资时钟中的位置意味着当市场流动性趋于紧张的时候成长因子表现较好,但是并不意味着流动趋于宽松的情形成长因子都表现不好,我们的分析中发现成长因子是在经济长期趋势的尾声叠加流动性趋于宽松的情形中表现不好
沪深300中质量,低波历年表现最好。
度量因子的指标:
IC值意义:量化因子预测能力强与否,因子对股票收益预测性强度。
IC分析在整个单因子分析中起主导性作用。
IC的大小反应了因子暴露值与股票表现之间的线性关系,IC绝对值越大说明因子的预测性越高,选股的效果就越好。
IC值取值:取值在-1到1之间,绝对值越大,表示预测能力越好。IC最大值为1,表示该因子选股100%准确,对应的排名分最高的股票,选出来的股票在下格调仓周期中涨幅最大;反之-1,则是反向指标。
实际中对于多年的IC均值,当IC绝对值>0.05时,就可以视为有效因子,当IC绝对值>0.1,就可以认为是很好的阿尔法因子了。当IC均值接近0,可视为无效因子。
因子IC的衰减分析:
Alpha因子的效用并非在未来n个月均匀分布,而是呈现逐步衰减的形态,也就是说我们从月初获得的alpha要比n个月后获得的alpha高,持仓n个月不动的调仓方式在后半段资金利用效率较低,有必要在alpha衰退之前调仓。
****IC_IR
获得稳定Alpha的能力:IR值IR的是InformationRatio的缩写,即信息比率。衡量因子IC的稳定性。IR指的是超额收益的均值与标准差之比。需要多个调仓期,每一个调仓期计算出一个IC值。
IR=(IC的多周期均值)/(IC的标准方差)IR大于0.5时,因子稳定获取超额收益的能力较强。IR等于多个调仓周期的IC均值除以这些IC的标准差,所以IR兼顾了因子的选股能力(由IC表征)和选股能力的稳定性(由IC的标准方差的倒数代表)
***********因子模型
资产预期收益率分解:
资产预期收益率等于该资产因子收益率及该因子暴露程度。
因子收益率构建:
因子收益率:由满足“(投资组合仅在目标因子有大于零暴露,其他因子暴露为零),(该组合特质风险最小)”这两条件的因子模拟投资组合下的收益率,则是该因子收益率。
第一步:将所有个股在该因子上的因子暴露在截面上标准化;
第二步:所有股票会按照因子的业务逻辑、根据因子暴露的数值从好到坏排列;
第三步:假设做多前10%或者20%的股票,做空后10%或者20%的股票,以此来构建一个零额投资的投资组合,它就是该因子的投资组合收益率就被称为这个因子的收益率。
前提:某因子构建的投资组合应该避免在其他因子上有任何暴露。
检查组合因子收益率是否有效方法:t值检验。
T检验,亦称studentt检验(Student'sttest),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。
t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
t值用公式t=(样本平均数x-总体平均数u)/(样本标准差s/根号(样本容量n))
查t表所得t统计量值越大,其尾端概率P越小。
*******
因子暴露值构建:方法一:将因子收益率作为解释变量,资产收益率作为被解释变量,进行时序回归,回归系数作为beta方法二:直接使用公司指标构成一个Pandas的Series类型的数据,索引为股票列表,值为对应标的因子值。然后对这列数据排序,做标准化、中性化等数据处理后,买入前或者后x分位标的。
例如:因子暴露就是股票在因子所代表的特征上的取值,比如一个股票的P/E为15.9,那么它对P/E因子的因子暴露就是15.9。
因子异象:在多因子模型中存在一部分无法被多因子模型解释部分,而且'显著大于零',则该部分称为异象。无法解释收益率部分。
异象有效检验步骤:
多因子模型:
多因子模型核心:解释股票预期收益和因子预期收益之间关系。通过收益预测,风险控制,组合优化构建投资组合,以最优的权重利用各因子预测收益率。
多因子模型简写:
E[R_i]=β_i×λ
E[R_i](E[.]为数学求期望公式,R_i代表股票i的超额收益)
=β_i为股票i的K因子暴露*λ因子收益率均值
模型意义:
横坐标为β_i
纵坐标为E[R_i]
斜率λ:因子的预期收益
每个点代表一支股票
α_i代表在每个样本内,E[R_i]和β_i×λ之间的残差
多因子模型反映的是收益率均值和因子暴露在截面上的关系。
如何检验好模型:
如果我们能够在统计上证明所有股票的α_i都很接近零,那么这个多因子模型就是很好的模型,就是所有这些α_i联合起来是否在统计上足够接近零。即统计意义上无误差,或误差非常小。
只有有了准确的(无偏且相合)估计值和正确的标准误,才能评价因子是否有效。
标准误:《百度百科》标准误,即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,反映的是样本均数之间的变异。标准误不是标准差,是多个样本平均数的标准差。
标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。
如何检验标准误通过GMM方法检验。
检验模型好坏三步骤:
1.挑选因子,计算个股在这些因子上的暴露β_i;
2.找到个股(超额)收益率均值E[R_i]和因子暴露β_i在截面上的关系;
3.计算每个个股的定价错误α_i,联合检验这些α_i是否在统计上为零。
因子预期收益率:使用因子投资组合收益率。
第一步:使用排序法构建因子投资组合,计算因子收益率。
例如,FamaandFrench(1993)提出了影响深远的三因子模型,它里面的三个因子,即市场、HML、SMB都是投资组合的收益率。
HML为例,它代表着highbook-to-marketratio公司相对于lowbook-to-marketratio公司的超额收益。
f_t表示t期因子(不同投资组合的收益率)
(每支个股i的收益率)R_it=
(截距)α_i+(个股i在因子上的暴露)β_i*(因子收益率)f_t+(随机的残差)ε_it
截面回归:适用更广泛,即适用风格因子,也适用宏观GDPCPI及利率宏观因子。因子收益率可以未知。因子可以不是portfolioreturns。比如因子可以是GDP、CPI、利率这些宏观经济指标。
第一步:利用N个时序回归得到每个因子暴露值,得到因子暴露值均值。
第二步:截面回归,使用上一步的因子暴露均值,k个资产收益率平均值,只做一次截面回归,使用OLS回归求解模型得到因子预期收益率,以及每个资产定价误差。
截面回归,从而确定每个因子的预期收益率λ。
个股的预期收益率(在整个T期的收益率均值)E[R_i]
=β_i*(因子预期收益率)λ+(代表股票定价错误的残差)α_i
在截面回归时采用OLS,截面回归OLS将通过原点并最小化所有个股残差α_i的平方和。
第三步:计算因子预期收益率标准误和资产定价误差标准误,构建t_统计量进行检验。使用GMM检验误差α_i是否为零。检查模型是否可靠。
FamaandFrench(1993)在CAPM的市场因子(MKT)基础上加入了价值(High-Minus-Low,即HML)和规模(Small-Minus-Big,即SMB)两因子,提出了Fama-French三因子模型,它也是多因子模型的开山鼻祖。
E[R_i]表示股票i的预期收益率-R_f为无风险收益率=β_MKT因子暴露*(E[R_M]为市场组合预期收益率-R_f)+β_SMB因子暴露*E[R_SMB]规模因子预期收益率+β_HML因子暴露*E[R_HML]价值因子预期收益率
价值因子:使用book-to-marketratio(BM)。规模因子:使用市值。
市场因子预期收益率:做多全市场市值加权指数同时做空无风险利率的组合。
价值因子预期收益率:以NYSE中上市公司BM的30%和70%分位数为界,把这三大交易所的上市公司分成三组:BM高于70%分位数的为High组、BM低于30%分位数的为Low组、位于中间的为Middle组。
S/H、S/M、S/L、B/H、B/M以及B/L。将每组中的股票收益率按市值加权得到6个投资组合;利用它们,FamaandFrench(1993)使用如下方法构造'市值HML”和'价值SMB'因子:如图:
在每年六月末,使用上一财年最新的财务数据对股票重新排序并对这两个因子进行再平衡。
优点:有足够的开创性缺点:“适用性”却有限,有很多其无法解释的异象。在众多异象中,最显著的当属截面动量异象。
2.Carhart四因子模型:在Fama-French三因子模型中加入了截面动量因子(取动量英文单词前三个字母、记为MOM)并提出了Carhart四因子模型:
E[R_i]表示股票i的预期收益率-R_f为无风险收益率=β_MKT因子暴露*(E[R_M]为市场组合预期收益率-R_f)+β_SMB因子暴露*E[R_SMB]规模因子预期收益率+β_HML因子暴露*E[R_HML]价值因子预期收益率+β_MOM动量因子暴露*E[R_MOM]动量因子预期收益率
动量因子预期收益率:在实际使用中,Carhart(1997)使用NYSE、NASDAQ以及AMEX的全部股票,每月末将它们按t-12到t-1这11个月的总收益率排序,并通过做多排名前30%同时做空排名后30%的股票构建动量因子。Carhart并未使用动量和市值进行双重排序,且在计算动量因子收益率时,多空两头内的股票均采用等权配置。
3.Novy-Marx四因子模型:增加了盈利因子
E[R_i]表示股票i的预期收益率-R_f为无风险收益率=β_MKT因子暴露*(E[R_M]为市场组合预期收益率-R_f)+β_PMU盈利因子暴露*E[R_PMU]盈利因子预期收益率+β_HML因子暴露*E[R_HML]价值因子预期收益率+β_UMD动量因子暴露*E[R_UMD]动量因子预期收益率
盈利因子使用毛利润
盈利因子预期收益率,使用相应的指标与市值进行双重排序法。以NYSE中上市公司的毛利润GP的30%和70%分位数为界,把NYSE、NASDAQ以及AMEX三大所上市公司依据毛利润GP高低分为盈利(Profitability,即毛利润GP在70%分位数之上)、中性(Neutral,即毛利润GP介于30%和70%分位数之间)以及不盈利(Unprofitability,即GP在30%分位数之下)三组。这三组和市值高低一起划分共得到6个投资组合:S/P、S/N、S/U、B/P、B/N以及B/U。每个组合中的股票均按其市值确定权重。
动量因子的投资组合每月进行再平衡,而价值和盈利因子每年六月末使用最新的财务数据重新构建投资组合。
4.Fama-French五因子模型EugeneFama和老搭档KenFrench在他们的三因子模型基础上添加了盈利和投资两个因子,提出了新的五因子模型
E[R_i]表示股票i的预期收益率-R_f为无风险收益率=β_MKT因子暴露*(E[R_M]为市场组合预期收益率-R_f)+β_SMB因子暴露*(E[R_SMB]规模因子预期收益率)+β_HML因子暴露*(E[R_HML]价值因子预期收益率)+β_RMW盈利因子暴露*E[R_RMW]盈利因子预期收益率+β_CMA投资因子暴露*E[R_CMA]投资因子预期收益率每年六月末,使用最新财务数据对股票重新排序并对规模、价值、盈利和投资这四个因子投资组合进行再平衡。
盈利因子预期收益率使用ROE和市值进行2×3双重排序,分别得到六个投资组合。
5.Hou-Xue-Zhang四因子模型又名q-factormodel风险收益率=β_MKT因子暴露*(E[R_M]为市场组合预期收益率-R_f)+β_ME因子暴露*E[R_ME]规模因子预期收益率+β_ROE盈利因子暴露*E[R_ROE]盈利因子预期收益率+β_I/A投资因子暴露*E[R_I/A]投资因子预期收益率
使用ROE和总资产变化率作为代表盈利和投资的指标。在构建因子时,为了体现上述条件预期收益率的关系,他们使用市值、单季度ROE和总资产变化率进行2×3×3独立三重排序,其中市值按纽交所中位数划分、ROE和总资产变化率按纽交所30%和70%分位数进行划分。
6.Stambaugh-Yuan四因子模型:在市场和规模因子的基础上,引入管理因子和表现因子,构建了四因子模型
E[R_i]表示股票i的预期收益率-R_f为无风险收益率=β_MKT因子暴露*(E[R_M]为市场组合预期收益率-R_f)+β_SMB因子暴露*(E[R_SMB]规模因子预期收益率)
+β_MGMT管理因子暴露*E[R_MGMT]管理因子预期收益率+β_PERF表现因子暴露*E[R_PERF]表现因子预期收益率
四因子模型中,管理因子和表现因子均源自关于错误定价的研究。错误定价意味着价格较内在价值的偏离,当价格高于内在价值时资产被高估,当价格低于内在价值时资产被低估。被高估的资产在未来由于价格的修正会出现较低的收益率,反之被低估的资产在未来则会获得更高的收益率。为了从错误定价中寻找因子的灵感,首先要找到衡量股票价格是否被高估或低估的指标。
以11个Fama-French三因子模型无法解释的异象为基础,构建了错误定价指标。这么做背后的逻辑是,异象的超额收益反映了其投资组合内股票的收益中无法被Fama-French三因子模型解释的超额收益,即个股的错误定价。因此,异象变量取值的高低就可以用来描述错误定价的方向(被高估或是低估)和大小。
第二组包含另外5个异象,即财务困境、O-分数、动量、毛利率以及总资产回报率。它们均和上市公司的表现有关,使用它们构建的因子被称为表现因子
使用全部异象变量对股票排序后,每支股票就有11个分数。把管理和表现两组内的6个和5个异象排名取平均,就得到每支股票在两组内各自的综合排名。综合排名越高,说明该股票价格越被高估,其未来预期收益越低;综合排名越低,说明该股票价格越被低估,其未来预期收益越高。
有了股票在管理和表现这两个变量上的排名,接下来使用市值和这两个变量依次进行2×3双重排序,构建管理、表现以及市值三个因子。
在使用市值排序时,该模型和其他多因子模型一致,使用NYSE包含股票的市值中位数将所有股票分为大、小市值两组。然而,对于管理和表现这两个变量则是将三大交易所的股票混合在一起,使用所有股票在这两个变量上各自的20%和80%分位数划分成高、中、低三组。这种做法和其他多因子模型的处理有两点不同:(1)划分的断点没有使用NYSE股票的分位数,而是全部股票的分位数;(2)划分阈值没采取传统的30%和70%分位数而是另辟蹊径采用了20%和80%的分位数
大量实证结果显示,错误定价在小市值股票中更为突出。这些特点使得传统的构造方法无法在规模因子的多、空两头对称地消除错误定价的影响,造成规模因子有被高估的偏误,因此不宜采用。正因如此,StambaughandYuan(2017)才采用了不同的方法构造规模因子。他们的实证表明,如此构造的规模因子比传统方法得到的规模因子有更高的风险溢价
7.Daniel-Hirshleifer-Sun三因子模型:
E[R_i]表示股票i的预期收益率-R_f为无风险收益率=β_MKT因子暴露*(E[R_M]为市场组合预期收益率-R_f)+β_FIN长周期因子暴露*E[R_FIN]长周期因子预期收益+β_PEAD短周期因子暴露*E[R_PEAD]短周期行为因子预期收益
背后逻辑:旨在捕捉由于过度自信(overconfidence)和有限注意力(limitedattention)造成的错误定价,从而解释学术界之前发现的大量选股异象。从行为金融学的角度出发,股票收益率之间的共同运动通常有两个原因:(1)股票错误定价上的共性;(2)投资者对于股票基本面新息的错误反应上的共性。
以上7个模型均是时序多因子模型
以上部分内容选自公众号《川总写量化》主流多因子模型巡礼
7.Barra模型
介绍:
BARRA模型是一种常用的多因子风险管理模型。我们可以把任何股票的收益率归因到几个不同的风险因子上,所采用的因子类型通常分为风格因子和行业因子两大类。
风格因子涵盖成长类、估值类、盈利类、规模、非线性规模类、流动类、财务杠杆类、Beta、波动率和动量十大类因子。
行业因子,按照WIND或者中信行业分类,每个行业对应一个行业因子,用于定量描述,行业属性为整体收益带来的影响。
模型构建:
Barra主要有归因分析模型和风险预测模型。
第一步:求因子暴露
直接使用股票指标求解因子暴露:
第二步:求因子收益率
利用横截面回归,在每一期通过个股收益率对因子暴露回归,估计因子收益率。在横截面回归中,因子暴露会根据公司特征的变化及时变化,每一期的因子暴露和因子收益率都是变化的,从而能够及时的反映市场变化情况。
第三步:构建模型
***************如何多类资产因子配置:
事例:桥水基金推出了“全天候”策略,策略本质基于宏观因子的资产配置框架。根据资产对'经济增长'和'通货膨胀'的因子暴露来分配资产,实现成功的资产配置策略。
债务驱动投资(LDI)策略,本质上,LDI方法将资产分为两个部分:“对冲因子'和'成长因子'投资组合。
对冲投资组合通常由长久期债券(long-du一rationbonds)组成,旨在模仿养老金的债务,目的是减少融资比率的波动性。建立对冲投资组合时,久期和收益率曲线敞口等指标至关重要。
成长因子投资组合可能包含股票、高收益资产、房地产或其他成长资产,目的是缩小融资比率缺口。在构建成长投资组合时,股票beta和收益率差(yieldspread)等指标较为重要。
配置因子类别:1.风格因子,依赖于一些股票异象提出的横截面资产定价风格因子。不同资产类别的因子组合可以组合成一个多元资产投资组合。
3.异质因子
因子配置方法:由于'宏观因子'和'风格因子'都可以解释资产收益率,将二者结合在同一个资产定价模型中,检验二者是否可以互补。
资产选择:1.股票:a.美国大盘股(R1000)b.美国小盘股(R2000)c.美国房地产投资信托基金(REIT)d.新兴市场(EM)2.固定收益:a.雷曼总债券指数(AGG)b.美国高收益债券(HYLD)c.通胀挂钩债券(TIPS)3.大宗商品:a.黄金b.道琼斯大宗商品指数(DJAIG)4.现金:a.现金(RF)
跨资产Alpha模型框架分为以下步骤:
1.选择宏观经济和风格因子,选择一组稳健的因子,宏观变量、风格因子和异质因子。如图:
宏观因子选择:经济增长(GRWTH)、通货膨胀(INFLTN)和实际利率(REAL)三因子
2.估算因子的暴露程度该投资组合对多种资产分配权重,以捕获承担相应因子风险的收益溢价。为了构建因子模拟投资组合,估算每种资产类别的'因子暴露',以便我们将'因子暴露'映射为资产权重。即因子暴露值高的,则该资产多配置。
风格因子暴露方法:每种资产的原始暴露值做了标准化处理(取Z-score)
'基于资产收益'的风格因子,直接比较不同资产类别的因子暴露,例如动量和波动因子。
风格因子,将滚动1年的累计收益作为动量,并将滚动1年的资产收益率标准差作为波动率。
3.构建因子模拟投资组合构建出战术策略和战略策略。战术配置(TAA)与战略配置(SAA)的差异起始于因子暴露的估算阶段。
对于战术配置(TAA)因子模拟投资组合,我们使用同期风险暴露来得到短期因子暴露相对于均衡状态的偏差。
对于战略配置(SAA)因子模拟投资组合,我们使用短期因子暴露的扩展窗口平均值来得到资产与因子之间的持久关系。
采用了因子模型方法来构建因子模拟组合。采用了Jones、Lim和Zangari(2007)的投资组合方法,可以看作是扩展的Fama–MacBeth回归。
假设用以下因子模型来表示资产收益:
R=FB+&R是模型范围中资产的收益向量,B是模型范围中宏观因子的暴露矩阵,F是所有宏观因子的模拟投资组合的收益向量。
结果:从战术和战略角度来看,所有因子都具有正的超额收益。这表明承担了系统性风险(尤其是宏观因子的风险),就会获得对应的正溢价。风格因子也具有正的回报溢价。战略因子相比,我们发现战术因子的表现具有更大的波动性。
4.预测因子组合收益生成的模拟因子组合的收益序列,我们可以更好地理解因子模拟组合的收益特性并做出预测。
即使用历史平均值作为预测值。为了区分长期预测和短期预测,我们使用滚动1年的因子模拟投资组合收益作为短期预测,使用扩展窗口均值作为长期预测。
5.创建最优因子组合
通过对因子模拟投资组合进行加权,可以得到最优因子投资组合。
构建组合的目标可以分为以下三类:风险最小化、目标因子暴露、最大化风险调整后收益。
本文采用了“最大化风险调整后收益'。长期来看,因子收益为正,然而我们仍然希望能够通过配置获得短期的收益。因此,我们在战术最优因子组合中并未对因子权重进行限制,对于战略最优因子组合来说,会对权重进行限制,限制权重大于0。在两种情况中,权重之和必须等于1。
6.推断资产预期收益
7.建立最终的最优投资组合
三种策略均产生了可观的风险调整后收益,夏普率均在0.82到0.94之间。根据下表,策略的年化换手率极低,为23%。此外,战术策略仍然产生了可观的信息比率,范围在0.52到0.75之间。
以上,内容摘自公众号《fofpower》资产配置vs因子配置—我们能否构建一类两者兼顾的策略
*******如何将因子暴露映射到资产配置
宏观因子使用:6个宏观经济因子是股权、实际利率、信用、通货膨胀、新兴市场和商品
举例
目标因子暴露:我们选择一组特定的目标暴露:如图
目标函数:
由于因子基准中有15种可投资资产,而只有六个因子
确定最优资产权重的目标函数定义如下:
使用平方因子暴露偏差与主动风险项的和最小,
其中平方因子暴露偏差指的是相对于因子基准的因子暴露偏差的平方,
主动风险项是惩罚系数λ乘以投资组合相对于因子基准的主动风险。
约束条件:完全投资与纯多头限制,最小交易量我们将资产的最小交易量设置为2.5%,资产类别约束,流动性,主动风险,换手率。
目标函数最优化过程:
*************
因子轮动:
因子的构建:因子标准化,因子方向变化,市值行业中性化。
大类因子表现测试:从IC测试和五分位组合测试两个维度对大类因子表现进行总结。
因子权重动态配置:举例:基于收益信息即(IC加权)动态配置因子:
基于风险信息(反向波动率加权)(风险平价配置)(最大分散化配置)(全局最小方差配置)(最小CVaR配置)的动态配置因子
基于收益与风险信息(历史ICIR加权配置)(最大化IR配置方法)(均值方差配置)的动态配置因子
效果评估:
举例:以'基于全A选股池'为样本
收益:基于中性化(IC加权)25.29%和(ICIR加权)26.13%在收益端增加最为明显,一般来看能够具备超过基准的收益;在风险调整后的表现方面,最大化IR、最大分散化方法具有更好的表现;
波动率:IC加权与ICIR加权方式权重的波动率较大
基于风险信息的配置方法权重波动率普遍较小
尾部风险维度:因子动态配置方法大体都能有效的降低投资组合尾部风险;其中最大分散化、最小方差、最小CVaR三类方法效果改进效果最为显著。
举例:以'基于沪深300股池'为样本收益:沪深300选股池中,IC加权和ICIR加权不存在对收益的增加效果(10.35%),(10.20%)