工业大数据分析算法实战pdf,mobi,epub,txt,百度云盘百度网盘免费下载电子书下载电子版全集免费阅读在线阅读精校版扫描阿里云盘Kindle资源ed2k微盘作者:田春华

《工业大数据分析算法实践》以工业大数据的特点和需求为牵引,阐述了工业大数据分析的算法与实现机制,使具有工科背景读者建立起数据思维,灵活利用数据分析算法进行实际问题的建模,并实现分析项目高效迭代与落地。具体主题覆盖了工业大数据分析工程思维和软件栈,工业数据的数据探索,预处理方法和常用机器学习算法,故障诊断、质量优化、流程优化的分析算法,专家规则驱动方法,以及工业数据分析工程等内容。

《工业大数据分析算法实践》分10章,可划分为四个部分。第一部分(第1章)是数据分析概览,目的是建立起数据分析算法的概念框架,并给出学习路线。第2~5章是第二部分,侧重在通用数据分析算法,包括数据预处理、机器学习、时序挖掘算法和*优化等其他算法。第三部分包括第6~8章,讨论了工业分析的算法思路,覆盖了生产质量分析(PQM)、生产效率优化(PEM)等典型分析课题的算法组合套路。第四部分侧重在分析工程方法,第9章讨论了工业专家知识沉淀方法,第10章讨论了数据分析的软件工程。

田春华

前言

在过去的五年中,笔者有幸深入制造业数字化转型一线,在与工业龙头企业深入交流和合作的过程中,目睹了国内产业数据基础的快速发展,也看到了数据思维模式的转变和对数据技术的理性认知。回想早年,为了验证数据分析技术,只能跨越地域、克服语言和文化的差异,到境外实施项目,不禁感慨万千。在过去的二十年中,数据平台技术、数据分析算法、计算资源技术和产业需求相互促进而蓬勃发展,数据思维成为了继逻辑思维、实证思维和构造思维之后的第四大思维范式。七十多年以来,大家一直在探索如何让计算机不用显式编程就能获得一定能力的人工智能技术之路,经历了符号演算、逻辑推理、自动机模型、进化计算、模糊数学、专家系统与知识工程、神经网络(特别是自动梯度计算与反演算法)、机器学习、深度学习等不同模式和阶段。得益于计算机硬件、产业数据的发展,机器学习和深度学习在行业应用已经取得了重大成功。但人工智能探索之路远未结束,科学家还在继续研究基于认知和进化等特点的强人工智能技术。另外,对于复杂系统的刻画与建模方法,也期待一些形式化方法的突破。古人有云,物含妙理总堪寻。

在过去五年的工程实践中,不时有工业界朋友提出,期望有本书能从算法应用的角度具象讲解工业数据分析课题。但我一直犹豫,一来市面上已经存在很多机器学习算法经典专著,也有很多优秀的算法工具图书,没有必要做重复工作;二来我与团队当时认为行业数据分析项目不落地的主要原因是分析课题定义不规范和数据不完备,而不是算法过程。因此,我们优先编写了《工业大数据分析实践》一书,尝试规范不同类型工业分析课题的定义过程。然而在该书出版后的几个月内,很多业界朋友再次表达类似的诉求,让我也逐渐意识到这种需求主要来自于工科背景人看问题的角度与统计思维不同,结构方程的惯性让大家下意识抵触非参数模型、隐性结构模型等计算模型。

本书尝试用工科人熟悉的思维模式去解释常见的机器学习算法。很多算法知识展开都可以单独成书,本书无意做重复工作,因此,本书中刻意避免了详尽的理论推导过程,仅讨论必要的理论思路和常见的认知障碍;在存在既有工具或图书的地方,直接给出参考文献,帮助读者快速建立起系统的认知框架;简化算法包使用过程的介绍,侧重算法背后的工作机制和超参数的影响分析,以及算法应用到工业场景中的套路。由此,本书的风格更像数据分析算法的辅助教材,侧重培养行业数据分析实操中的直觉研判力。

本书共10章,可划分为四个部分。第一部分(即第1章)是数据分析概览,目的是建立起数据分析算法的概念框架,并给出学习路线;第2~5章是第二部分,侧重在通用数据分析算法,包括数据预处理、机器学习、时序挖掘算法和zui优化等其他算法;第三部分包括第6~8章,讨论了工业分析的算法思路,覆盖了生产质量分析(PQM)、生产效率优化(PEM)等典型分析课题的算法组合套路;第四部分侧重在分析工程方法,第9章讨论了工业专家知识沉淀方法,第10章讨论了数据分析的软件工程。

田春华2021年12月于北京

目录

丛书序一

丛书序二

第1章工业大数据分析概览

1.1工业大数据分析的范畴与特点

1.1.1数据分析的范畴

1.1.2典型分析主题

1.1.3工业数据分析的特点

1.1.4数据分析的典型手段

1.2数据挖掘的过程方法

1.2.1CRISP-DM简介

1.2.2分析课题的执行路径

1.3数据分析工具软件

1.3.1脚本语言软件

1.3.2图形化桌面软件

1.3.3云端分析软件

1.4工业大数据分析师的算法修养

1.4.1分析算法理解的维度与路径

1.4.2必读图书

1.4.3分析算法背后的朴素思想

1.4.4工程化思维

参考文献

第2章数据预处理

2.1数据操作基础

2.1.1数据框的基本操作

2.1.2数据可视化

2.2数据分析的数据操作技巧

2.2.1cumsum等primitive函数的利用:避免循环

2.2.3时序数据可视化:多个子图共用一个x轴

2.2.4时序数据可视化:NA用来间隔显示时序

2.2.5参数区间的对比显示(在概率密度图上)

2.2.6获取R文件的所在路径

2.2.7分段线性回归如何通过lm()实现

2.3探索型数据分析(EDA)

2.3.1引言

2.3.2R语言EDA包

2.3.3其他工具包

2.3.4小结

2.4数据质量问题

2.4.1数据的业务化

2.4.2业务的数据化

2.4.3机理演绎法

2.4.4细致求实的基本素养

2.4.5小结

2.5特征提取

2.5.1基于数据类型的特征提取

2.5.2基于关联关系的特征自动生成

2.5.3基于语法树的变量间组合特征生成

2.6特征选择

2.6.1特征选择的框架

2.6.2搜索策略

2.6.3子集评价

2.6.4小结

第3章机器学习算法

3.1统计分析

3.1.1概率分布

3.1.2参数估计

3.1.3假设检验

3.2统计分布拟合

3.2.1引言

3.2.2基于核函数的非参数方法

3.2.3单概率分布的参数化拟合

3.2.4混合概率分布估计

3.2.5小结

3.3线性回归模型

3.3.1引言

3.3.2基础线性回归模型——OLS模型

3.3.3OLS模型检验

3.3.4鲁棒线性回归

3.3.5结构复杂度惩罚(正则化)

3.3.6扩展

3.4多元自适应回归样条(MARS)

3.4.1引言

3.4.2前向计算过程

3.4.3后剪枝过程

3.4.4变量重要性评价

3.4.5MARS与其他算法的关系

3.5神经网络

3.5.1ANN逼近能力的直观理解

3.5.2极限学习机

3.6决策树

3.6.1决策树的概念

3.6.2决策树构建过程

3.6.3常用决策树算法

3.7支持向量机(SVM)

3.7.1引言

3.7.2epsilon-SVR算法

3.7.3nu-SVR算法

3.7.4不同SVM算法包的差异

3.7.5扩展

3.8隐马尔可夫模型

3.8.1引言

3.8.2工作原理

3.8.3示例

3.8.4讨论

3.9概率图模型与贝叶斯方法

3.9.1引言

3.9.2朴素贝叶斯

3.9.3贝叶斯网络

3.9.4一般图模型

3.9.5讨论与扩展阅读

3.10集成学习

3.10.1引言

3.10.2Bagging方法

3.10.3Boosting方法

3.10.4Stacking方法

3.11模型评价

3.11.1引言

3.11.2评价指标

3.11.3评价方法

3.11.4特征重要度

3.12聚类

3.12.1引言

3.12.2基于距离的聚类:K-means、PAM

3.12.3基于层次的聚类:Hclust

3.12.4基于密度的聚类:DBSCAN

3.12.5基于分布的聚类:GMM

3.12.6聚类结果的评价

3.13关联规则

3.13.1引言

3.13.2关联规则概念与度量指标

3.13.3关联规则实现过程

3.13.4关联规则算法

3.13.5关联规则可视化

3.13.6关联规则评价

3.14深度学习

3.14.1引言

3.14.2深度学习算法分类

3.14.3深度学习框架

3.14.4常见疑惑

3.14.5深度学习算法的加速

3.15机器学习算法的其他视角

3.15.1计算负载模式

3.15.2并行化计算

3.15.3新计算范式

第4章时序数据挖掘算法

4.1时序算法简介

4.2信号处理算法

4.2.1傅里叶变换的直观理解

4.2.2时频分析

4.2.3时序变换

4.2.4压缩感知

4.3时序分解

4.3.1STL

4.3.2奇异谱分析

4.3.3EMD及扩展方法

4.4时序分割

4.4.1Changepoint

4.4.2TreeSplit

4.4.3Autoplait

4.4.4应用示例

4.5时序再表征

4.6序列模式挖掘

4.6.1数值型频繁模式

4.6.2符号型频繁模式

4.7时序异常检测

4.7.1基于度量的方法

4.7.2基于模型重构的方法

4.7.3基于频繁模式挖掘的方法

4.8时序聚类

4.8.1DTW距离

4.8.2SAX距离

4.9时序分类

4.9.1经典分析算法

4.9.2深度学习的方法

4.10时序预测

4.10.1基于时序分解的预测算法

4.10.2基于回归建模的预测算法

第5章其他算法

5.1优化算法

5.1.1模型分类

5.1.2经典组合优化模型

5.1.3典型工具

5.2规则推理算法

5.3系统辨识算法

5.3.1算法分类

5.3.2典型工具

5.4特定数据类型的算法

5.4.1文本数据

5.4.2图像数据

5.4.3时空数据

第6章工业分析中的典型处理方法

6.1工业分析中的数据预处理

6.1.1工况划分

6.1.2数据缺失

6.1.4强噪声

6.1.5大惯性系统

6.1.6趋势项的消除

6.2通用时序特征

6.3典型征兆特征

6.3.1毛刺检测特征

6.3.2单调趋势模式

6.3.3平稳过程的漂移检测

6.3.4多点位不一致

6.3.5超界

6.3.6变点检测

6.3.7一维曲线平滑与分区

6.3.8二维形状分析

6.3.9持续某种状态

6.4工业时序分析问题

6.4.1工业时序数据的特点

6.4.2短时序分类问题

6.4.3长时序分类问题

6.4.4不同类型问题的转换

第7章生产质量数据分析算法

7.1概述

7.2基础算法

7.2.1物料跟踪模型

7.2.2过程稳定性监控

7.3时空模式分析

7.4连续流程生产

7.4.1应用示例

7.4.2工况划分

7.4.3操作参数优化

7.4.4其他分析

7.5批次流程生产

7.5.1应用示例

7.5.2理想工艺过程拟合

7.5.3动态控制优化

7.6离散生产

7.6.1应用示例

7.6.2佳工艺路径挖掘

7.6.3异常排查

7.6.4操作参数优化

7.7总结

第8章生产效率优化

8.1决策优化问题的建模思路

8.2线性规划的建模技巧

8.2.1绝对值

8.2.2Min-Max问题

8.2.3分式目标函数

8.2.4范围约束

8.3整数规划的建模技巧

8.3.1决策变量值域不连续

8.3.2目标函数不连续

8.3.3或关系约束

8.3.4条件型约束

8.3.5逻辑表达式

8.3.6消除变量相乘

8.3.7大M法

8.4应用示例:电梯养护服务优化

8.4.1业务问题描述

8.4.2问题一:路线优化

8.4.3问题二:排班计划

8.4.4思考与小结

8.5经营预测类问题

8.5.1预测量的要素分解方法

8.5.2例外场景的处理

8.5.3宏观环境变化的处理方法

第9章行业知识沉淀方法

9.1讨论范畴

9.1.1知识类型

9.1.2技术方法

9.1.3业务领域

9.1.4方法论的作用

9.1.5现有的知识沉淀方法论

9.2知识沉淀方法的维度模型

9.3模型要素维度

9.3.1共性要素

9.3.2传感器异常报警

9.3.3异常预警:“特征量-征兆量-研判规则”的范式

9.3.4健康评估:“劣化度-健康度-综合评价”的范式

9.3.5故障类型研判:“特征量-证据/现象-推理逻辑”的范式

9.3.6故障处置效果监控:“症状-异常类型/严重等级-处置措施-状态”的范式

THE END
1.大数据分析建模思路技巧和算法大数据建模常用方法本文介绍了大数据领域建模的方法。 一、大数据领域建模综述 1.1 为什么需要数据建模 有结构地分类组织和存储是我们面临的一个挑战。 数据模型强调从业务、数据存取和使用角度合理存储数据。 数据模型方法,以便在性能、成本、效率之间取得最佳平衡。 成本:良好的数据模型能极大地减少不必要的数据冗余,也能实现计算结果复用https://blog.51cto.com/u_16099164/6430927
2.大数据优化建模与算法.zip大数据建模与优化算法大作业资源《大数据优化建模与算法》课程资料集合包含了丰富的学习资源,涵盖了大数据处理中的核心概念、优化模型以及多种算法。此压缩包主要针对大数据环境下的数据分析和优化问题,旨在帮助学习者深入理解如何在海量数据中寻找模式、进行分类和分析。 文档"上机作业.docx"可能是课程的实践练习,它可能包含了一些实际操作任务,让学生https://download.csdn.net/download/qq_45289233/13729573
3.大数据分析建模有哪些算法帆软数字化转型知识库大数据分析建模有多种算法,包括决策树算法、支持向量机(SVM)算法、随机森林算法、K-means聚类算法、线性回归算法、逻辑回归算法、神经网络算法和贝叶斯分类算法。其中,决策树算法是一种使用树状模型对数据进行分类和回归的方法。决策树算法通过递归地将数据集分成更小的子集,同时相应地构建树结构,使其能够对未知数据进行https://www.fanruan.com/blog/article/71906/
4.大数据优化建模与算法大数据建模方法 作者:张平文 ISBN:9787040530490 出版社:高等教育出版社 出版年:2019 大数据时代的商业建模 作者:范若愚 ISBN:9787543958685 出版社:上海科学技术文献出版社 出版年:2013 最优化 :建模、算法与理论 作者:刘浩洋[等]编著 ISBN:9787040550351 出版社:高等教育出版社 https://www.las.ac.cn/front/book/detail?id=e37891687151d0cb4b34daae7e66317d
5.想问问大数据优化建模与算法这门课怎么样呀?西安电子科技大学吧贴吧用户_5NU3C2V 竹园丁香 1 想问问 大数据优化建模与算法 这门课怎么样呀?不晓得这门课给分和考核是什么样的 老师没说,感觉心慌慌,看起来好难登录百度账号 扫二维码下载贴吧客户端 下载贴吧APP看高清直播、视频! 贴吧页面意见反馈 违规贴吧举报反馈通道 贴吧违规信息处理公示0https://tieba.baidu.com/p/8615670955
6.C++技术中的大数据处理:如何使用机器学习算法进行大数据预测和建模?利用c++++ 中的机器学习算法进行大数据预测和建模包括:使用分布式处理库(如 spark)处理大数据集。使用智能指针和引用计数管理内存。利用多线程提高性能。常见的机器学习算法包括:线性回归、逻辑回归、决策树和 svm。实战案例:使用c++和逻辑回归预测客户流失,包括数据准备、模型训练、模型评估和模型部署。 https://www.php.cn/faq/787756.html
7.基于大数据建模和AI算法的反电信诈骗精准预警与阻断平台基于此,研发了“基于大数据建模和AI算法的反电信诈骗精准预警与阻断平台”,该平台整合公安警情数据及构建多维欺诈场景专题库,实现预警数据的整合(运营商、金融、互联网等),通过自主研发的大数据建模和AI算法,不断挖掘出预警线索,通过云端呼叫座席实现全网协同高效劝阻,全面服务于电信欺诈预警防控体系。https://skl.qhnu.edu.cn/info/1032/1250.htm
8.大模型数据工程实战:ArenaLearning通过模拟LLM竞技场来构建大规模数论文使用 K-Means 聚类算法将源数据处理成 500 个类别。从每个类别中,随机选取两个样本,构建 1000 个多样性样本,创建 Offline-Diverse WizardArena。 困难子集 从每个类别随机选择 20 个样本,形成一个包含 10000 条的数据集,然后使用 GPT-4 按难易程度从 0 到 10 评估每个指令,并筛选出难度最高的 1000 条数https://zhuanlan.zhihu.com/p/880435490
9.DizzyK/ustccyber大数据算法 密码工程原理与实践 数据建模与分析基础 网络优化导论 机器学习及其安全应用 网络空间安全数学建模基础 2020级王小谟英才班 专业核心课 编译原理和技术 ( H ) 编译原理和技术的高级课程 2020级第二学士 必修课 网络算法学 数字图像处理与分析 https://toscode.gitee.com/DizzyK/ustc_cyber_security
10.PW3300边缘大数据模型智能算法大数据建模模块 系统将得到的大数据通过智能算法形成稳态的数字模型。 大数据模型调用模块 在锅炉生产运行中自动采集数据并通过智能筛选数据。 基于边缘大数据模型精准喷氨控制方法包括:数据采集筛选模块、数据建模模块、精准喷氨模块和大数据模型调用模块。 大数据模型是锅炉生产运行中自动采集数据后通过智能算法形成的。智能分http://www.jspwhj.com/productinfo/2570517.html
11.针对公安民警开展数据建模方法的研究和实践本文旨在探索一种面向广大民警的可视化建模方法,通过放开数据操作权限、赋予可视化建模能力,催生更多警务应用模型。 导读 2018年3月,公安部科技信息化局以公安基层技术革新奖推荐评选为载体,以公安大数据建设应用为主线,组织开展了“智慧公安我先行”全国公安基层技术革新专项活动。新智认知自主研发的产品“自主数据建模的可https://www.secrss.com/articles/7120
12.大数据挖掘企业服务平台大数据挖掘企业服务平台是由泰迪智能科技自主研发打造的数据挖掘建模平台,供企业/高校使用.此外平台还配置AI大模型服务,大数据分析可视化平等服务,致力于为使用者打通大数据全链路,精准助力大数据和人工智能为产业转型升级赋能!https://python.tipdm.org/
13.科学网—热点专题数据驱动控制学习及优化过程工业大数据建模研究展望 人们对大数据的认识已从"3Vs" (Volume-大容量; Variety-多样性; Velocity-处理实时性)、"4Vs" ("3Vs"与Value-价值)、到现今的"5Vs" ("4Vs"与Veracity-真实性).在此背景下, 首先分析过程工业大数据的"5Vs"特性; 接下来, 综述现有数据建模方法, 并结合过程工业大数据特有性质 https://blog.sciencenet.cn/blog-3291369-1180355.html
14.探索与实践以《大数据分析实务》课程为例为提升教学成效不断丰富资源和数字化手段:1.自建微课、二维情境动画以及3D仿真动画,打造沉浸式学习场景,助力学生理解抽象的数据建模过程。2.自建数据算法探索3D游戏,强化小组自主探索和互动思考,充分激发学生兴趣。3.自主运营微信公众号,拓展大数据应用相关知识,提升迁移能力。4.引入行业前沿大数据建模系统,助力学生通过可视https://www.gzqy.cn/sgxjsztw/info/1043/1726.htm