浙江大学数学科学院继续教育中心

《人工智能-机器学习开发工程师》项目

人工智能开发工程师学习计划,全程实战案例,从机器学习原理到推荐系统实现,从深度学习入门到图像语义分割及写诗机器人,再到专属GPU云平台上的四大工业级实战项目。三个月完美掌握人工智能开发工程师的必备技能。实现从【程序猿】向人工智能/机器学习工程师的华丽转型。

适用人群

理工科0基础,逻辑思维能力强的小白

数据分析师

数学/统计学/物理学专业人员

豪华讲师团队

宣晓华

华院数据董事长兼CEO

加州大学伯克利分校数学博士

复旦大数据学院特聘教授

中国工业和应用数学学会副理事长

上海大数据联盟副理事长

段勇

前杭州数云联合创始人兼CTO

前华院数据大数据挖掘技术总监

上海连尚网络(WiFi万能钥匙)AI技术和应用专家

杨晶晶

华院数据首席人工智能专家、计算机硕士

张帅

华院数据人工智能专家、人工智能博士

五层级能力训练示意图

我们的课程侧重于第2、3、4层次人才的培养,也是人工智能领域未来需求量最大的应用工程类层级的人才培养,课程侧重于快速上手、代码实现、工程应用

强大的课程体系

《人工智能-机器学习开发工程师》课程体系大纲

阶段一、代码级

Python是非常流行的数据科学和机器学习语言,是通向人工智能必须要过的第一关。通过本阶段的学习,学生将掌握python的编程语法和常用技巧,并系统学习python中用于数据分析和机器学习的常用工具,为后续进一步学习人工智能/机器学习更高级的内容打下坚实且必要的基础。

学完后能达到的水平:针对Python数据分析师工作岗位需求打造

重要程度:

难度系数:

阶段二、应用级

此阶段侧重于机器学习的算法基础了解及算法的Python代码实现。通过对基本的数理统计知识的学习,了解机器学习必须掌握的算法原理及Python代码实现,达到利用Pyhton代码结合算法解决实际人工智能/机器学习业务分析预测的目的。

学完后胜任的工作岗位:数据挖掘/分析师、人工智能/机器学习开发工程师(初级)

阶段三、工程级

此阶段侧重于对人工智能/机器学习工作流程中最重要的几个环节,通过对数据准备、数据特征、数据模型的深入介绍及算法优化,结合深度学习和具体的经典案例,让学员对于机器学习上升到工程应用的级别,能够进行基本的算法评估与优化。

学完后胜任的工作岗位:

人工智能/机器学习开发工程师(中级)、人工智能/机器算法工程师(初级)

阶段四:算法级

此阶段会让学员对人工智能/机器学习算法有更进一步的深入理解,主要涉及深

机器学习、深度学习的代码实现。

人工智能/机器学习开发工程师(高级)、人工智能/机器算法工程师(中级)

深度学习应用开发工程师、人脸识别应用开发工程师

阶段五:专家级

此阶段偏大数据+人工智能及真实项目实战,大数据部分侧重于大数据快速入门

及大数据分析并结合人工智能的一些具体应用,项目主要对时下流行且主流的人工智能/机器学习的项目为主线进行讲解。直接拿阿里天池大赛、Kaggle数据竞赛数据,通过具体的项目实战机器学习、数据分析\挖掘,让学员对之前所学的知识得到充分应用,从而达到融会贯通、举一反三的目的。借助四大商业级项目实战,让学员对推荐系统、大数据下的人工智能应用有一个全面的理解与认识,让学员在工作中有机会冲击数据科学家工作岗位,从而成为这个领域的专家。

人工智能/机器学习开发工程师(资深)、人工智能/机器算法工程师(高级)、数据科学家

阶段六:综合项目演练

项目实战一:基于FP-growth算法实现的新闻网站流量点击分析系统

项目说明:在新闻网站上,一个会用户不断点击和浏览各种新闻报道,最终该用户的这些点击会被记录下来,成为该用户点击的历史记录。而所有用户的点击历史记录,是一个蕴含了巨大价值的数据集。我们可以从各个角度,使用不同的方法来进行有价值的挖掘,并应用到不同的任务中去。本项目就是从用户点击的历史记录中,挖掘频繁项集,以便知道哪些新闻报道是经常关联在一起的。从而为网站的新闻版面排版,新闻推荐等提供科学的参考。主要涉及到FP-growth、FP-tree等算法的综合运用。

项目实战二:基于聚类(Kmeans)算法实现的客户价值分析系统

项目说明:客户价值分析其实就是一个客户分群问题。是以客户为中心,先从客户需求出发,搞清楚客户需要什么,他们有怎么样的一个特征,他们需要什么样的产品,然后我们再回头设计出相应的产品,以满足客户的需求。之所以要进行客户价值分析,就是商家为了避免闭门造车,主观臆断客户需要什么什么什么。随着数据量不断增大,传统的拍脑袋做决定的决策方式,变得越来越过时了。

那具体到我们这个项目呢,我们这个项目的背景是某电信运营商,该运营商需要以客户为中心,按照客户的需求,在对客户特点的了解上,推出不同的资费套餐和营销手段,以便更好地留住现有客户,吸引新的客户。

项目实战四:基于SVD协同过滤算法实现的电影推荐系统

项目说明:协同过滤推荐技术是推荐系统中应用最早和最为成功的技术之一。它一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,系统从而根据这一喜好程度来对目标用户进行推荐。协同过滤最大优点是对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐、电影。

项目实战五:基于OpenCV、随机森林算法实现的图像分类识别系统

项目说明:该系统针对图片分类问题进行分析和讨论,旨在提取图片中的脸部轮廓,利用图像的详细信息对比不同图片中的相似度,从而实现对相册图片的自动分类管理。利用OpenCV中提供的图像检测和图像识别的功能,即使用哈尔小波变换(Haar)和Adaboosting算法进行检测,找出图片中特定区域,进而使用局部二进制模式直方图(LBPH)对人脸进行预测,获得两张图片之间的相似度,依照目录整理后,可达到图片按图片分类的效果。在此基础上设计用户操作界面,实现简易、快捷的操作。软件测试结果表明,该软件图像检测和图像匹配的成功率

较高,为生活提供了便利。

项目实战六:基于NLP自然语言构建的文档自动分类系统

项目说明:随着互联网技术的迅速发展与普及,如何对浩如烟

项目实战七:Kaggle经典AI项目:预测房价系统全程实战

项目实战八:基于RFM模型实现的零售精准营销响应预测系统

业务目标:如何评估客户价值、如何筛选最优质的客户进行精准营销、预测客户的营销响应度涉及算法:

-逻辑回归

-决策树

-支持向量机

-随机森林

项目实战九:天猫、京东电商双11实时商品推荐展示分析平台

项目说明:对于电商、金融、电信、交通等行业,需要对用户购物数据、现金消费数据、上网浏览数据及路况状态数据进行实时统计分析与展示,以便实时商品推荐和货量调度、实时交易风控及实时交通监控和疏导。由于此类数据产生快且多,业务本身需要数据产生之时就要进行实时快速的处理,以便进行展示。当前大数据分析技术框架中,实时流式计算框架Strom和SparkStreaming被逐渐使用,比如电商公司的销售营业额的实时统计(Storm/-JStorm),苏宁顺丰的物流实时追踪监控(SparkStreaming)等都是实时的数据分析处理。

项目实战十:基于Mahout、SparkMlib实现的推荐系统(电影推荐、社交推荐)

项目说明:推荐系统是大数据中最常见和最容易理解的应用之一,最著名的应用恐怕就是亚马逊公司的推荐引擎,其为浏览Amazon.com网站的用户提供个性化的内容。但是不仅仅只有电子商务公司会用推荐引擎为用户提供额外的商品,推荐系统也可以被用在其他行业,以及具有不同的应用中使用,从推荐音乐、活动、产品到约会对象。本课程主要讲述了大数据环境的下推荐系统从零搭建的全过程,通过两个项目实现全程内容贯穿,主要课程目标如下:

目标一:掌握推荐系统的原理

目标二:能够基于mahout、sparkMLlib进行推荐系统的开发

商业项目实战-01:基于AI人脸识别技术实现的“仿美颜相机-自拍坊”企业级应用

项目说明:本项目模仿了:美颜像机自拍加特效的核心功能实现,是一个有料有趣的应用,项目虽小,但功能技术点确非常的多,包括但不限于:人脸识别技术应用、摄像头的控制、图像库的处理,GitHub的使用等。代码略加改造即可应用在实际工业生产项目中,可以讲是一个集趣味,技术,算法与商业应用为一体的课程,具有很高的实用价值!

商业项目实战-02:基于深度学习的CT图像肺结节自动检测技术(深度学习在医疗行业的实践应用\CPU、GPU两套运行环境)

本课程是由一线的深度学习工程师结合实际商业医疗的应用场所景给出的一套解决方案,涉及大量的深度学习技术,并给出了CPU、GPU两套运行环境,具有非常强的学习与商业应用价值!

备注:课程的具体课时安排,老师根据学院和班级情况适当调整。

学习方式:

三种学习方式,可根据学生的实际情况进行灵活选择。三种学习方式价格不等。

THE END
1.9个常用数据结构与算法的C语言代码实现快速排序是一种常用的排序算法,其基本思想是通过选定一个基准元素,将待排序序列划分为两个子序列,其中一个子序列的所有元素均小于等于基准元素,另一个子序列的所有元素均大于等于基准元素,然后对两个子序列分别进行递归排序,最终将整个序列排序。以下是一个简单的快速排序实现示例代码:#include <stdio.h>void https://baijiahao.baidu.com/s?id=1763048454408546168&wfr=spider&for=pc
2.常用算法代码常用算法代码 这篇文章包含了一系列算法实现,如计算两个数的最大公约数(GCD)和最小公倍数(LCM),筛选法求素数,查找回文数,以及解决字符串子串匹配和连续子数组最大和的问题。还提到了优化输入输出和数据结构在处理大量数据时的重要性。 摘要由CSDN通过智能技术生成https://blog.csdn.net/qq_44380224/article/details/123455379
3.可能是你看过最全的十大排序算法详解(完整版代码)C语言排序算法是程序中常用的算法,下面这篇文章主要给大家介绍了关于十大排序算法的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下+ 目录 GPT4.0+Midjourney绘画+国内大模型 会员永久免费使用!【 如果你想靠AI翻身,你先需要一个靠谱的工具!】前言https://www.jb51.net/article/251992.htm
4.数据挖掘算法代码数据挖掘算法案例数据挖掘算法代码 数据挖掘算法案例 数据挖掘作为一门新兴的多学科交叉应用技术,正在各行各业的决策支持活动中扮演着越来越重要的角色。数据挖掘概念的定义描述有若干版本,本文采用的是一个普遍接受的定义:数据挖掘,又称为数据库中的知识发现(KDD),它是一个从大量数据中抽取出未知的、有价值的模式或规律等知识的复杂https://blog.51cto.com/u_16213642/7090644
5.ModelArts创建算法ModelArts用户指南训练过程中,自定义算法需要从OBS桶或者数据集中获取数据进行模型训练,训练产生的输出结果也需要存储至OBS桶中。用户的算法代码中需解析输入输出参数实现ModelArts后台与OBS的数据交互,用户可以参考开发自定义脚本完成适配ModelArts训练的代码开发。 创建自定义算法时,用户需要将算法代码中定义的输入输出参数进行配置。 https://ecloud.10086.cn/op-help-center/doc/article/72086
6.腾讯算法岗武功秘籍(上)所以,不要存在侥幸心理,踏踏实实的刷题,复习好常规机器学习算法,尤其是算法的原理和应用场景。 ★ 项目和比赛经历非常的重要,往往面试官都是根据项目里用到的方法拓展提问,对项目的优化和改进也问的比较多。还有就是能内推的一定去找学长学姐或是其它资源去内推。 ★ 面试过程中如果实在写不出来代码的话,就给https://www.flyai.com/article/930
7.算法与数据结构复杂度分析粗略地说,算法的执行效率是算法代码执行的时间。但是,如何在不运行代码的情况下,用“肉眼”获得代码执行时间呢? 这里有一个很简单的代码,请求 1,2,3n 累加和。现在,我将带您一起估计代码的执行时间。 int cal(int n) { int sum = 0; int i = 1; for (; i <= n; ++i) {https://www.tulingxueyuan.cn/tlzx/jsp/5158.html
8.C语言快速排序算法及代码快速排序是对冒泡法排序的一种改进。那么有关C语言快速排序算法和代码分别又是怎样的呢?以下仅供参考! 快速排序算法 的基本思想是:将所要进行排序的数分为左右两个部分,其中一部分的所有数据都比另外一 部分的数据小,然后将所分得的两部分数据进行同样的划分,重复执行以上的划分操作,直 到所有要进行排序的数据变https://www.oh100.com/kaoshi/c/542712.html
9.算法和编程面试题精选TOP50!(附代码+解题思路+答案)这份面试资源主要包含五部分内容:数组、链表、字符串、二叉树和重要算法(如排序算法)的编程面试题,其中每部分内容我们都列出了一些最常被问到的热门问题,并且在每个题目后给出了可以参考的解决思路和代码,因为题目较多,我们没有罗列所有的方法和代码,只给出了访问地址。相信大家在掌握了这些内容后,一定可以提升实力、https://cloud.tencent.com/developer/article/1483807
10.Delphi采用LZ77算法的一段压缩代码window基础Delphi采用LZ77算法的一段压缩代码 核心提示:const MAX_WND_SIZE=1024;procedure Write12BitStream(pbuffer: pchar; bitoffset: ULONG);var bytebound, const MAX_WND_SIZE=1024;procedure Write12BitStream(pbuffer: pchar; bitoffset: ULONG); varhttp://www.2ccc.com/news/Html/?875.html
11.科学网—二维三次卷积插值算法及Fortran代码更新二维三次卷积插值算法及Fortran代码【更新】 |个人分类:数学轮子|系统分类:科研笔记|Fortran程序, 插值算法 最近有人问起二维三次卷积插值算法(Cubic Convolution Interpolation)及其程序的问题,我想到这种插值算法也能用于图像的插值,所以也就有了兴趣,稍微了解了一下,并试着用Fortran实现了一下,同时也顺便复习了一下https://blog.sciencenet.cn/blog-2277-595297.html