中美量化对冲基金行业的表现的显著差异,引人深思,A股量化对冲基金对指数的超额收益,是一个短暂的套利窗口期,还是一个可以持续的例外情形?
尼德霍夫具有深厚的统计学和经济学、金融学学术功底(本科毕业于哈佛大学统计和经济学,博士毕业于芝加哥大学金融和经济学),他始终相信投机市场有“屠龙术”,人们可以找到“公式”,然后在市场上去证实这个公式。两次的失败,都因为不符合他的模型和世界观的”黑天鹅”出现。
以他为代表的,接受现代金融理论和计量经济学、统计学训练的量化对冲基金占了量化对冲基金的大多数,MarcosLopezdePrado在近年来的一系列论文和讲座中,对以计量经济学、统计学为代表的量化投资理论和实践进行了反思:
量化投资失败的第一个原因——经济学研究的停滞:
分类器,聚类,神经网络,机器学习
(classfier,clustering,neuralnetwork,machinelearning)
量化投资失败的第二个原因:计量经济学无法处理非结构化数据:
1、信息最丰富的数据集不适用于计量经济学。
高维数据集:变量的数量往往超过观测值的数量。
稀疏/噪声数据集:每单位信号中有很大比例的零值或噪声。
层级关系:经济系统往往涉及代理人网络(networksofagents)和聚类依存关系(cluteringofdependecies)image.png通胀估计从非结构化的网上价格而来并形成对年化通胀水平的准确预测.
2、标准计量经济学转换以牺牲平稳性为代价。具体详见:《AdvancesinFinancialMachineLearning:Lecture2/10》
3、计量经济学方法为无趣数据建模。
2、因此,大多数计量经济学研究得出的结论都是错误的,其依据是噪音,而不是信号!
量化投资失败的第四个原因——方差判定错误和因果关系谬误:
1、计量经济学规范试图判定(adjudicate){Xt,i}为{yt}的样本内方差,同时控制被判定为{Zt,j}的方差。
2、这带来了两个问题:
样本内判定对策略开发极少有用
模型也需要判定控制变量{Zt,j}的方差
3、相比之下,机器学习方法尝试使用{Xt,i}预测样本外的{yt},同时控制{Zt,j}(无论规范如何)
4、回归是错误的投资工具:计量经济学借用了生物学的工具包,但在生物学中,样本外预测不是一个关键目标。
因果谬误
根据论文《RegressionandCausation:ACriticalExaminationofSixEconometricsTextbooks》发现:在最具影响力的计量经济学教材中,有六本出现了基本的数学和统计错误:
1、混淆了因果关系
2、混淆预测与因果关系
3、混淆因果关系与格兰杰因果关系(用词不当,误称)
4、未能提供区分因果概念和统计概念的一致数学符号
量化投资失败的第五个原因——规范交互寻找(specification-interactionsearch)的问题:
考虑典型的计量经济模型:
1、这要求研究人员立即获得两项:
①预测变量:{1,2}
②函数形式:典型的线性规范,具有乘法交互作用
2、鉴于金融体系的复杂性,这些要求是不切实际的。
传统的计量经济学模型并不“学习”数据的结构。
除非我们提供确切的(未知的)规范(specification),否则我们将得出错误的结论。
量化投资失败的第六个原因——统计学中P值的滥用:
在p=0.05时,大多数策略是错误的假设一个经过回测的策略,盈利的概率是1%。
然后,在5%的显著性和80%的power的标准阈值下,研究员预计将在1000次测试中做出58项发现,其中8项为真阳性,50项为假阳性。
在这种情况下,p值为5%意味着至少86%的发现是假的!
在实践中,金融中的错误发现率远高于86%,因为:
1、由于多次测试,familywise的显著性水平远远大于5%
2、由于竞争,发现新策略的概率低于1%
3、策略的保质期很短。策略不会保持一直“正确”超过几个月或几年
4、规范错误和其他违反假设的行为进一步增加了错误发现率
计量经济学陷入了p<0.05的时代
1、尽管金融经济学的大多数研究结果都依赖于p<0.05的论点:
(2)在多元共线性回归量(multicollinearregressors)的一般情况下,p值不能被稳健地(robustly)估计。
2、通过p值发现的“统计显著”因素包括:
价值、动量、质量、规模、Carry,流动性、防御性等(Value,Momentum,Quality,Size,Carry,Liquidity,Defensiveness,etc.)
对p值的滥用如此普遍,以至于美国统计协会(AmericanStatisticalAssociation)已经不鼓励将p值作为统计重要性的衡量标准(Wasserstein等人[2019])。这使人们怀疑数十年的计量经济学研究。
量化投资失败的第七个原因——模型训练的过拟合问题:
1、统计模型可能在两方面过度拟合:
①训练集过度拟合:规范非常灵活,可以解释噪声(而不是信号)
②测试集过度拟合:根据测试集表现来选择模型(同时隐藏了其他表现较差的模型)
2、计量经济学正在很大程度上无法解决和量化这两个问题。
量化投资失败的第八个原因——金融研究的偏差问题:
金融机构如何进行研究:
1、假设你正在寻找一种投资策略。运行了许多计量回归模型,并找到实现高夏普比率的结果,其中一些高于3
2、你把这些结果展示给你的老板,他决定对策略进行几周的模拟测试。幸运的是,模拟测试表现似乎与回测一致,所以投资决策委员会批准策略的部署
3、给该策略分配了1亿美元,但不幸的是,不久后就出现了20%的亏损
4、这种策略从来没有像宣传的那样有效,而且它最终也会失效!
发生了什么?
1、最好的回测结果不能代表基本事实(选择性偏差)
2、将回测限制在一些规范内并不是一个解决方案(确认性偏差)
大多数计量(量化)投资之所以失败,是因为投资经理们和学术期刊无法控制选择性偏差和确认性偏差!
克服量化投资缺陷的方法:
MarcosLopezdePrado认为金融从业者和研究者可以使他们的研究方法更加现代化来克服量化投资的上述缺陷,比如量化投资的每个步骤的缺陷,都有一个相应的机器学习的工具包来辅助:
参考资料:
The7ReasonsMostEconometricInvestmentFail,MarcosLopezdePrado
《AdvancesinFinancialMachineLearning:Lecture2/10》,MarcosLopezdePrado