手把手教你使用Logistic回归LDA和QDA模型预测指数涨跌 1 引言机器学习(Machine Learning)是人工智能(AI)的重要组成部分,目前已广泛应用于数据挖掘自然语言... 

机器学习(MachineLearning)是人工智能(AI)的重要组成部分,目前已广泛应用于数据挖掘、自然语言处理、信用卡欺诈检测、证券市场分析等领域。量化投资作为机器学习在投资领域内最典型的应用之一,已经越来越广泛的出现在我们的视野中。

机器学习可简单理解为利用统计模型或算法拟合样本数据并进行预测,其模型算法根据学习任务可以分为分类、回归和聚类。分类方法是对离散型随机变量建模或预测的监督学习方法。分类是按照某种标准给对象贴标签,再根据标签来区分归类。而所谓的学习,其本质就是找到特征与标签间的关系(mapping即映射)。换句话说,分类预测模型是一个从输入特征到离散的输出标签之间的映射函数。分类方法常用的有朴素贝叶斯、分类树、支持向量机、KNN、集成学习(包括随机森林)和深度学习等。

股票指数涨跌的预测本质上是一个分类问题。机器算法有很多种,没有最好的模型,只有更适合解决当前问题的算法。当然,本文的目的不是寻找最优的算法,而是机器学习在分析预测的应用。基于此,本文以Logistic回归(LR)、线性判别法(LDA)、二次判别分析(QDA)模型为例,对上证综指的涨跌进行预测。后续推文将会应用其他可能更有效的算法,包括SVM、集成学习和深度学习等。

逻辑回归(LogisticRegression,LR)是广义线性回归分析模型之一,其本质属于分类问题,因此主要用于被解释变量为分类(离散,如0,1)变量的情形。在分类问题上,逻辑回归要优于线性回归,因为线性回归在拟合被解释变量为离散时会出现负概率的情况,会导致错误的样本分类。而逻辑回归采用对数函数将预测范围压缩到0与1之间,从而提升预测准确率。

假设L1,L2,…Ln为预测因子,LR模型使用对数公式对上涨(U)的条件概率建立以下模型:

一般使用最大似然法来拟合上述模型。关于逻辑回归的详细推导此处不再展开,想进一步了解的可以找本计量经济学入门教材学习(如伍德里奇的《计量经济学导论》)。机器学习库scikit-learn提供了估计模型的“黑盒子”。

线性判别法(LDA)

线性判别分析,全称LinearDiscriminantAnalysis(LDA)与LR的区别在于,LR使用对数函数将P(Y=U|L1,L2,...,Ln)建模为给定预测变量Li的响应Y的条件分布;在LDA中,给定Y,分别对Li变量的分布进行建模,并通过贝叶斯定理获得P(Y=U|L1,L2,...,Ln)。

本质上,LDA是通过假设预测变量来自多元高斯分布得出的。在计算出该分布的参数的估计值之后,可以将这些参数输入贝叶斯定理中,以便对观测值属于哪个类别做出预测。LDA假定所有类别共享相同的协方差矩阵。由于scikit-learn提供了拟合和预测方法,所以不用太担心对预测所需的分布或后验概率的公式不了解。

二次判别分析(QDA)

预测主要分为三个步骤:

第一,根据上证综指指数收益率的正负划分为上涨(1)和下跌(-1)两种类型,作为被解释变量。

df=pd.DataFrame()

#上涨用1表示,下跌(含0)为-1

df=df.dropna()

returndf

预测准确率:LR模型:0.557LDA模型:0.566QDA模型:0.590

从模型的预测准确率来看,并不是很理想,三个模型中使用QDA的效果要好一些(可能因为训练数据集样本较多,而测试集分配较少),准确率也只有0.59,只比投掷硬币好一丁点。下面以QDA模型为例,使用混淆矩阵和ROC曲线对模型的预测性能作进一步评价,混淆矩阵图没有给出,ROC曲线图很直观,此处不过多分析。model=QDA()

model.fit(X_train,y_train)#模型在测试数据集上的预测

pred=model.predict(X_test)

#构建混淆矩阵

cm=pd.crosstab(y_test,pred)

cm

#绘制混淆矩阵图

#计算正例的预测概率,而非实际的预测值,用于生成ROC曲线的数据

y_score=model.predict_proba(X_test)[:,1]

#fpr表示1-Specificity,tpr表示Sensitivity

fpr,tpr,threshold=roc_curve(y_test,y_score)

#计算AUC的值

roc_auc=metrics.auc(fpr,tpr)

#绘制面积图

plt.figure(figsize=(8,6))

#添加对角线

#添加文本信息

#添加x轴与y轴标签

plt.show()

本文主要以逻辑回归(LR)、线性判别分析(LDR)、二次线性判别分析(QDR)为例,展示了机器学习算法在股价涨跌预测上的应用。模型预测效果不甚理想,并不代表机器学习算法的失效,主要原因可能是没有选择好合适的预测的因子,关于什么样的因子才是预测股指涨跌的最好因素留待读者自己去挖掘(这也是量化研究者孜孜不倦在追求的)。

THE END
1.2024新人教版小学信息科技五年级全一册上学期核心素养教案+配套第1课 生活处处有算法 第2课 算法认识与体验 第3课 游戏体验寻规律 第4课 算法应用在身边 第5课 数学运算讲方法 第6课 判断选择用分支 第7课 重复操作用循环 第8课 算法验证与实现 第9课 互传密信有诀窍 第10课 猜数游戏有https://mp.weixin.qq.com/s?__biz=MzI4MzcxMzcwOA==&mid=2247748755&idx=5&sn=d6a91870341140ae41596f7341a7c06b&chksm=ea82eb5897bc43372166795730e01142d6dde773f610f303895849255eaef8bd80213db33e40&scene=27
2.五分钟学算法青少年人工智能资源与创新平台五分钟学算法授课教师:王晓茹价格免费学习有效期 长期有效 免费加入 简介 学习目录简介 缜密的思维,形象的语言,妙绝的思路,再难的算法,也能信手拈来,娓娓道给你听! 王晓茹,博士,任教于北京邮电大学计算机学院,副教授、硕士生导师。曾在美国MIT(麻省理工学院)和美国PSU(波特兰州立大学)访问学习。现任中国人工智能https://yuanzhuo.bnu.edu.cn/goods/show/33
3.全网最全程序员学习网站汇总,还不赶快收藏地址: 五分钟学算法 简介:有少量非常不错的数据结构、算法相关的内容。 推荐指数:? 13、犬小哈教程网 地址: 犬小哈教程网 简介:少量哈士奇的技术问答漫画很有意思。 推荐指数:? 15、原创技术大联盟 地址: 原创技术大联盟 简介:优秀的技术博主实在太多了,列不完,也看不完,这里有一个导航页https://www.songma.com/news/txtlist_i66992v.html
4.五分钟学算法个人网站:https://www.cxyxiaowu.com 动态规划 1 概念 动态规划算法是通过拆分问题,定义问题状态和状态之间的关系,使得问题能够以递推(或者说分治)的方式去解决。在学习动态规划之前需要明确掌握几个重要 阅读全文 posted @ 2019-11-15 14:13 五分钟学算法 阅读(1429) 评论(5) 推荐(0) 编辑 https://www.cnblogs.com/fivestudy/
5.双非本科跨专业5面京东,8600小时后收到通知,流下喜悦泪水1、自我介绍 2、如何学习Java 3、遇到问题 4、了解面试的什么部门吗? 5、了解业务吗? 6、下载京东健康APP去了解了吗 7、一会儿会给你结果,去官网查就行了 (D)伴鱼 (一)一面: 算法题(没思路5分钟可以换题) 1、按奇偶排序数组II(给定一个非负整数数组 A, A 中一半整数是奇数,一半整数是偶数。 对数组https://maimai.cn/article/detail?fid=1632778078&efid=DWfu7WeSgiHv2qWOUabF1g
6.MindSpore官网该能力兼容Ascend、GPU、CPU多平台,隐蔽不同环境适配的繁琐细节,让用户在打开IDE后一键运行AI算法。最快能在5分钟内体验用昇思MindSpore全场景AI框架学AI的乐趣,内测数据显示80%的AI零基础用户使用该功能可在20分钟内完成环境配置与算法运行。 7.2 沉浸式昇思MindSpore全场景AI框架生态知识智能搜索,用户零压力接入昇https://www.mindspore.cn/news/newschildren?id=967
7.每周文娱观察2017.2.17后者由清华大学和北京理工大学牵头,阿里云支撑实验室研发全生命周期大数据系统软件及其开源创新平台体系。在“工业大数据应用技术国家工程实验室”未来规划中,阿里云将负责云计算大数据基础平台,参与工业相关算法服务的建设和维护,同时支持航天科工资源整合,在工业测控技术方面开展研究及试点行业应用。http://www.leshanvc.com/cygc/23764.html
8.写给自己链接警告宋浩java5、Google Developers 七、小微型博客 1、美团技术团队 2、阮一峰的网络日志 3、Spring Boot中文导航 4、Spring Cloud中文导航 5、Web前端导航 6、Spring For All 7、廖雪峰的官方网站 8、bugstack 9、Java技术驿站 10、酷壳 11、床长人工智能教程 12、五分钟学算法 https://blog.csdn.net/m0_57434744/article/details/128572484
9.湖北工业大学2024年硕士研究生招生简章湖北工业大学创建于1952年,是一所以工学为主,经济学、法学、教育学、文学、理学、医学、管理学、艺术学、交叉学科等十大 学科门类协调发展的多科性大学,是湖北省“双一流”建设高校、国家“中西部高校基础能力建设工程”高校、全国毕业生就业典型经验 高校、全国深化创新创业教育改革示范高校、国家知识产权试点高校、国家https://hzmba.com/article/hubeigongyedaxue2024nianshuosh.html
10.算法数据结构体系学习班马士兵教育官网算法体系班https://www.mashibing.com/course/339
11.河北大学文学院2024年硕士研究生复试实施细则2. 拟定初试成绩与复试成绩加权比是7:3。总成绩具体算法为:总成绩=初试总成绩[总分500分的÷5;总分300分的÷3]×70%+复试成绩×30%。 3. 特殊类考生加分政策见研究生院复试录取办法。 五、录取程序 1. 以招生专业(方向)为单位,按一志愿考生总成绩排序,依据招生指标数确定拟录取考生名单。(复试考生总成绩相https://wxy.hbu.cn/info/1049/3121.htm
12.全栈金融工程师算法技术解构scikit-learn支持多种格式的数据,包括经典的iris数据,LibSVM格式数据等等。为了方便起见,推荐使用LibSVM格式的数据,详细见LibSVM的官网。 (8)Statsmodels Statsmodels是Python的统计建模和计量经济学工具包,包括一些描述统计、统计模型估计和推断。包括线性回归模型、一般线型模型、robust linear models、离散选择模型(logit)https://www.jianshu.com/p/6c3888c2e846
13.360WiFi官网5、良好的沟通和表达能力,具备快速的学习和研究能力 请发简历至haoyun@360.cn Android研发工程师 岗位职责: 1、负责360免费WiFi安卓客户端的研发 任职资格: 1. 扎实的计算机基础知识,丰富的实际代码编写经验 2. 良好的数据结构和算法基础 3、熟悉 Java/C++,Android SDK/NDK https://wifi.360.cn/help/joinus
14.开发者必备:基于Linux生态的十大AI开源框架盘OSCHINAMLlib 目前支持分类、回归、推荐、聚类、生存分析等多种机器学习算法。 官网:https://spark.apache.org/mllib/ 5. Apache Mahout:Hadoop 广泛采用的机器学习开源框架 Apache Mahout 同样也是一个 Apache 开源项目,与 MLlib 相对应,Mahout 是应用在 Hadoop 平台下的机器学习开源框架。 https://www.oschina.net/news/80995/top-ai-open-source-linux-ecosystem-framework
15.力扣(LeetCode)全球极客挚爱的技术成长平台零起步学算法 以非常通俗易懂的讲解,带领新手朋友们进入「算法与数据结构」学习的大门。 灵茶山艾府?10 个月前 分享丨【题单】图论算法(DFS/BFS/拓扑排序/最短路/最小生成树/二分图/基环树/欧拉路径) DFS 一路到底,BFS 由近及远。 DFS 基础 找连通块、判断是否有环等。部分题目做法不止一种。 1383 https://leetcode-cn.com/
16.吴师兄学算法的个人主页动态程序员的快乐往往就是这么朴素无华且枯燥!我,打开了LeetCode官网,打算随意的做几题,看到877号问题几百个字的描述我却使用一行代码仅仅11个字母就AC,哎,枯燥。想象 3 吴师兄学算法 CTO @全网同名:吴师兄学算法 · 5年前 LeetCode 第 287 号问题:寻找重复数,一道非常简单的数组遍历题,加上四个条件后感觉https://juejin.cn/user/4230576474426685
17.苹果团队首发文,揭露让iPhone支持深度学习算法面临的诸多挑战雷锋网消息,苹果 Vision 框架的发布,意味着开发者可以在 App 中使用深度学习算法和许多其他的计算机视觉技术。那么,支持这一创造性革新的背后,苹果团队面临了哪些挑战?日前,苹果在其官网发文,首次揭露了这些信息。详情如下,雷锋网编译整理: 苹果在 iOS 10 中开始使用深度学习技术。随着 Vision 框架的发布,开发者可以https://www.leiphone.com/category/industrynews/zCmFyITNzSt3dWuw.html
18.3分钟理财加拿大凤凰预测算法在线预测(2024排行榜徐高(中银证券首席经济学家):这次会议提到,适度增加中央预算内投资,并且提到以政府投资有效带动社会投资,这意味着我们将重点关注能够产生宏观的社会效益的投资,在物流、交通等方面的投资就是这样,它们可以通过系统性地带动全社会多领域的发展,来创造需求稳定增长。 https://m.dslyy.com/teeq77DtEsV01QUN1216.html