走进大道丨极端行情下量化中性策略的应对 01. 创始人团队全球Top10对冲基金从业背景大道投资的创始团队由朱明强和刘小康组成,他们是清华大学的校友,也是量化投... 

大道投资的创始团队由朱明强和刘小康组成,他们是清华大学的校友,也是量化投资的坚定信仰者。

朱明强先生本科毕业自清华大学,当时他就读的专业是汽车工程。虽然他在专业上取得了亮眼的学术成绩,但他深觉在工程领域之外挥之不去对于数学这个学科的深度热爱。于是在清华毕业后,他坚定地选择赴美攻读UCLA的应用数学博士,并在顶尖教授的指导下充分展示了自己的数学天分和才华。

首先大道秉承——从数据中找寻投资之“道”的投资理念,认为真正的Alpha是蕴藏在data里面,对数据的深度和广度的挖掘构成了其Alpha的一切。多年来,他们持续在不同的市场行情和环境下积累数据、进行精细研究,并持续迭代优化策略。不断优化软硬件设施,坚定量化投资信仰,时刻保持敬畏之心。所有这些因素共同构成了大道投资在量化市场上的持续生命力和核心的竞争优势。

研究流程始于原始数据,其中包括约60%的量价数据、约20%的基本面数据以及约20%的另类数据等。这些数据经过清洗和标准化处理后,分发给研究员,他们根据个人擅长和兴趣进行因子挖掘和模型构建等工作。研究员的主要任务是产出有效的模型,这些模型会在风险管理和约束的基础上,由PM进行最终的模型加权和组合优化。

大道采用多模型研究框架,与传统的多因子框架可能有所不同。这一方法基于长期主义思维,致力于培养投研人才,每位研究员能够完成从因子挖掘到模型构建再到组合优化的全过程,最终成长为一名在量化领域拥有复合经验的优秀基金经理。

在策略研发上涵盖了三大层面,包括海量数据挖掘;运用各种前沿科学的计算机模型进行构建和使用,包括因子挖掘、因子组合、日内回转T0及算法交易模型;由IT团队负责维护自研的交易系统、数据网络、并行算力以及实时监控和数据分析平台。

(1)Alpha策略包括传统的因子策略、价量技术面策略、量化基本面策略、机器学习策略等,其利用量化选股模型挑选出一篮子超越指数的股票组合,并通过做空等量的股指期货来获取相对稳定的Alpha收益。

在风控管理上严格约束,运用自研风控系统+barra风控模型进行风险管理。平均持仓大约有1,800只股票,每只股票的市值上限不超过1%,以确保风险分散,多空头敞口基本达到完全对冲状态,市值上的敞口一般不超过3%,通过在盘中自动匹配股票和等量的股指期货仓位来实现。

(2)T0策略是在Alpha底仓基础上,利用A股市场内的日内短线交易机会。能够平滑交易曲线,降低回撤和波动,以此增强底仓收益,平均持仓时长在15-30分钟内。

1.大道在底层的基差管理模型方面积累了丰富的经验,模型每天都会进行仓位的优化管理,综合考虑未来的超额收益和基差成本之间的关系。在这一轮量化极端行情开始发酵的过程中,模型已经预测到未来超额收益可能会衰减。再叠加基差成本的扩大的因素,中性产品的仓位得以及时动态地缩减。在节前已经逐步进行降仓,根据优化器得出的结果,最终降到了20%的仓位,这有效降低了由于基差收敛和超额衰减引起的双重回撤,从而极大程度地保护产品的净值,使其没有受到太大的冲击。

2.优化器具备自适应调整风险敞口的功能,在这次下跌中得到了极大的验证。选用的模型预测到某些风格因子,尤其是size因子和非线性市值因子的风险急剧放大,因此自动动态地收紧了基金组合在这些因子上的暴露。这种动态的风格调整极大地降低了由风格因子风险敞口造成的净值回撤。

在后续,大道将进一步在风控上引入极限思维,他们认为:在极端行情下,以风控为出发点的思维能够为投资者提供最大的保护。

Q:中性策略代表产品目前管理规模及上限大概是多少?

A:目前公司整体管理规模近14-15亿,中性策略规模占比60%,预计策略容量可达50亿-80亿。

Q:实盘因子数量有多少?子模型的构建方式?

A:我们实盘的因子积累了大约五六百个有效的因子。这些因子到子模型的构建包括线性方式和非线性方式,在子模型的组合中,大多数采用线性模式,而部分会利用机器学习方法。

Q:包括基本面、价量、事件驱动等各类子模型占比是?从因子到模型主要用哪些方法组合?策略的换手率?

A:在我们的实盘交易中,子模型可以大致分类为基本面模型、另类模型和量价模型。在量价模型中,我们进一步分为机器学习的量价模型、行为金融学模型和传统的量价模型。这些模型的占比大致如下:基本面模型和另类模型约占30%,机器学习的模型约占40%,传统的量价模型和行为金融学模型约占30%。

我们的因子到子模型的主要非线性组合方式包括两种:一种是树模型,主要采用流行的XGBoost算法。另一种是神经网络模型,我们也在尝试使用一些高频数据进行组合。

中性策略持股数在1800左右,持股越分散,更容易做T0策略的叠加,所以会有更高的换手率,大约为80倍左右。

Q:不同的子模型预测周期是?每天盘中进行交易的频率?

A:产品整体预测的覆盖周期在3到5天之间,普通版本通常为3到5天,低波版本则约为7天。整天持续交易基于T0模型,交易频率是每五分钟进行一次持续的交易,开盘时信号较多且较强,约占一天交易量的30%。

Q:基差管理模型的信号触发频率?前几次触发是在什么情况下?能否举例说明?

A:在中性收益中,空头收益变得越来越重要,我们对空头基差管理也日益重视。其实并非简单地根据基差的大小来触发机制,而是将股票收益和基差收益融合在一起,同时考虑交易成本和市场冲击成本进行优化。基差管理模型每15分钟发出一次信号,根据实时的基差对股票预测进行调整,是一个缓慢的交易过程。我们的基差管理模型在过去几年中表现良好,能够通过降仓避免大幅回撤,尤其在2021初年小盘和大盘切换时表现出色,而节前的这波行情其实与21年初类似。

Q:行为金融学模型与量价模型的区分?

A:行为金融学模型强调可解释性和逻辑性,通常基于研究报告、论文以及国内外的研究成果,同时也会借鉴美股的思路,尝试吸取各种思路,注重逻辑的建立。而机器学习模型则更注重大量数据和因子的输入,能够自动提取规律,但也可能存在过拟合的问题。我们在机器学习方面深挖较多,日间和日内的方法论相对来说较为成熟,也努力控制过拟合,以确保实盘表现的稳定性。

THE END
1.数据挖掘类文章属于什么类型mob64ca12e83232的技术博客数据挖掘类文章属于什么类型 数据挖掘是一种从大量数据中提取隐含的、有用信息和知识的过程。它涉及统计学、机器学习、数据库技术等多门学科,因此数据挖掘类文章通常属于数据分析、机器学习和统计学等类别。本文将介绍数据挖掘的基本概念,并结合具体的代码示例,展示如何使用Python进行简单的数据挖掘任务。https://blog.51cto.com/u_16213397/12827058
2.数据挖掘基础知识解析:关联规则发现与分类算法评价标准详解1. 一家超市研究了销售记录数据,发现购买啤酒的人很可能也会购买尿布。这属于什么类型的数据挖掘问题? (一个) A.关联规则发现 B. 聚类 三、分类 D.自然语言处理 2. 哪两个分类算法的评价标准对应于以下两个描述? (一个) (a) 警察抓小偷,描述被警察抓到的人有多少是小偷的标准。 http://www.yl101.com/detail/id/87990.html
3.如何用通俗易懂地解释什么是数据挖掘举例子说明你对数据挖掘的理解如何用通俗易懂地解释什么是数据挖掘 通常我们把信息转化为价值,要经历信息、数据、知识、价值四个层面,数据挖掘就是中间的重要环节,是从数据中发现知识的过程。 举个例子来说明。(例子仅供解释,不包含其他意思,Σ( °△°|||)︴) 傍晚你一个人从火车站出来,看到路边有一个漂亮妹子,这个妹子朝你抛了一个媚眼https://blog.csdn.net/DataCastle/article/details/78132088
4.简述bi理论的基本要点并举例说明?一、简述bi理论的基本要点并举例说明? BI(Business Intelligence) 是一种运用了数据仓库,在线分析和数据挖掘等技术来处理和分析数据的崭新技术,目的是为企业决策者提供决策支持。功能 BI 是一个工厂; BI 的原材料是海量的数据; BI 的产品是由数据加工而来的信息和知识;BI 将这些产品推送给企业决策者;企业决策者利https://www.lnky.net/gthq/65034.html
5.数据挖掘的应用领域,并举例说明数据挖掘的应用领域,并举例说明 数据挖掘(Data Mining)是一种从大量数据中提取出有意义的信息和模式的技术。它结合了数据库、统计学、机器学习和人工智能等领域的理论和方法,通过高效的算法和工具,对大数据进行分析和挖掘,从而揭示数据中隐藏的规律、关联和趋势,支持决策和预测。https://www.elecfans.com/d/2395155.html
6.与“五彩缤纷”在意思有什么不同?请解释并举例说明。6. 举例说明什么是关系模型,什么是关系、属性、元组、关键字、关系模式。 7. 有哪些关系运算?举例说明什么是投影,选择,连接? 8. 简述SQL语言有什么作用? 9. 什么是大数据?举例说明大数据的价值何在? 10. 什么是数据挖掘? 点击查看答案 第6题 4、1-4、请解释什么叫一次能源?什么叫二次能源?并请举例说明?https://www.shangxueba.cn/wangke/ICJAHM45.html
7.上海市高等教育自学考试连锁经营管理专业(专科)(630604)商业2、简单运用:四象限评价法(波士顿矩阵法)把商品分为四类,分别对这四类商品举例并加以说明归类理由。 第三章 品类管理 一、学习目的和要求 通过本章学习要掌握品类与品类管理的基本概念,了解品类管理执行机构,掌握品类市场分析方法和品类结构分析方法,了解品类模板的建立,掌握品类的实施推广。 https://www.shmeea.edu.cn/page/04400/20190517/12734.html
8.人工智能经典习题集及各章总结(期末考试必备)江阴雨辰互联5、 人工智能有哪些应用领域或课题?试举例说明 难题求解、自动规划、调度与配置、机器定理证明、自动程序设计、机器翻译、智能控制、智能管理、智能决策、智能通信、智能仿真、智能CAD、智能制造、智能CAI、智能人机接口、模式识别、数据挖掘与数据库中的知识发现、计算机辅助创新、计算机文艺创作、机器博弈、智能机器人。 https://www.yc00.com/xiaochengxu/1690506190a360936.html
9.算法工程师机器学习面试题总结(2)腾讯云开发者社区需要注意的是,离散化也可能带来一些问题,比如可能损失一部分信息,或者引入过多的离散变量导致模型复杂度增加。因此,在使用离散化来提升逻辑回归效果时,需要综合考虑问题的特点、数据的分布以及业务需求,并进行实验验证。 类别不平衡问题你是如何处理的?什么是过采样,什么是欠采样?举例说明 https://cloud.tencent.com/developer/article/2322940
10.数据挖掘论文【摘要】由于我国的信息技术迅速发展,传统档案管理的技术已经不能满足现代的信息需求,数据挖掘技术的应用为档案管理工作效率的提升带来便利。本文通过说明数据挖掘技术的有关内容,阐明数据挖掘技术的相关知识,并对数据挖掘技术在档案管理工作中的实际运用来进行举例分析。 https://www.unjs.com/lunwen/f/20220924130749_5650839.html
11.举例说明银行风控中常用的技术手段大数据风控模型是银行风控中最为核心的技术手段之一。它基于海量数据,通过数据挖掘、机器学习等技术手段,构建出针对各类风险的预测模型,为银行提供风险识别、评估、监控和预警等全方位的风险管理服务。 以信贷业务为例,银行可以通过收集客户的个人信息、征信数据、交易记录等多维度数据,构建出信贷风险评估模型。该模型能够https://www.meipian.cn/53kn8560
12.数据挖掘概念imba数据挖掘 什么是数据挖掘 数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。 并https://www.cnblogs.com/xuasmi/articles/1295768.html
13.浙江传媒学院《跨媒体数据可视化》20223、(本题5分)描述数据挖掘中的关联分析和序列分析的区别,举例说明它们在零售行业中的应用,并解释如何从分析结果中获取有价值的信息。4、(本题5分)解释什么是迁移学习在数据分析中的应用,说明其优势和适用场景,并举例分析。三、论述题(本大题共5个小题,共25分)1、(本题5分)在电信行业的套餐设计中,如何借助https://www.renrendoc.com/paper/368147258.html
14.(集合)物流供应链管理论文15篇改良传统的数据挖掘模式, 以电商为基本的营销平台和销售渠道, 从供应链的角度出发, 为客户提供最原始的数据和信息需求。第二, 利用天猫等强大的数据平台控制住商业流量。第三, 利用菜鸟数据来整合整个物流和快递行业, 在全国各地的核心城市进行圈地计划, 从而建立多个供应物流站, 为偏远地区提供基本的优质服务。第四https://www.yjbys.com/biyelunwen/fanwen/jiaotongwuliu/735283.html
15.数据挖掘的基本概念和工作流程金融IT那些事儿大数据分析和挖掘是数字经济时代的重要技能。今天我们来学习一下数据挖掘,介绍一些基本概念,并以CRISP-DM方法为例着重说明数据挖掘的工作流程。 01 数据挖掘对于数据业务化意义重大 什么叫数字化?一切业务数据化,一切数据业务化。数据业务化绝不是数据的简单展现,而是要将数据中的价值提炼出来,并在实际业务中应用,支持https://www.shangyexinzhi.com/article/4052696.html