浙江大学数学科学院继续教育中心

《人工智能-机器学习开发工程师》项目

人工智能开发工程师学习计划,全程实战案例,从机器学习原理到推荐系统实现,从深度学习入门到图像语义分割及写诗机器人,再到专属GPU云平台上的四大工业级实战项目。三个月完美掌握人工智能开发工程师的必备技能。实现从【程序猿】向人工智能/机器学习工程师的华丽转型。

适用人群

理工科0基础,逻辑思维能力强的小白

数据分析师

数学/统计学/物理学专业人员

豪华讲师团队

宣晓华

华院数据董事长兼CEO

加州大学伯克利分校数学博士

复旦大数据学院特聘教授

中国工业和应用数学学会副理事长

上海大数据联盟副理事长

段勇

前杭州数云联合创始人兼CTO

前华院数据大数据挖掘技术总监

上海连尚网络(WiFi万能钥匙)AI技术和应用专家

杨晶晶

华院数据首席人工智能专家、计算机硕士

张帅

华院数据人工智能专家、人工智能博士

五层级能力训练示意图

我们的课程侧重于第2、3、4层次人才的培养,也是人工智能领域未来需求量最大的应用工程类层级的人才培养,课程侧重于快速上手、代码实现、工程应用

强大的课程体系

《人工智能-机器学习开发工程师》课程体系大纲

阶段一、代码级

Python是非常流行的数据科学和机器学习语言,是通向人工智能必须要过的第一关。通过本阶段的学习,学生将掌握python的编程语法和常用技巧,并系统学习python中用于数据分析和机器学习的常用工具,为后续进一步学习人工智能/机器学习更高级的内容打下坚实且必要的基础。

学完后能达到的水平:针对Python数据分析师工作岗位需求打造

重要程度:

难度系数:

阶段二、应用级

此阶段侧重于机器学习的算法基础了解及算法的Python代码实现。通过对基本的数理统计知识的学习,了解机器学习必须掌握的算法原理及Python代码实现,达到利用Pyhton代码结合算法解决实际人工智能/机器学习业务分析预测的目的。

学完后胜任的工作岗位:数据挖掘/分析师、人工智能/机器学习开发工程师(初级)

阶段三、工程级

此阶段侧重于对人工智能/机器学习工作流程中最重要的几个环节,通过对数据准备、数据特征、数据模型的深入介绍及算法优化,结合深度学习和具体的经典案例,让学员对于机器学习上升到工程应用的级别,能够进行基本的算法评估与优化。

学完后胜任的工作岗位:

人工智能/机器学习开发工程师(中级)、人工智能/机器算法工程师(初级)

阶段四:算法级

此阶段会让学员对人工智能/机器学习算法有更进一步的深入理解,主要涉及深

机器学习、深度学习的代码实现。

人工智能/机器学习开发工程师(高级)、人工智能/机器算法工程师(中级)

深度学习应用开发工程师、人脸识别应用开发工程师

阶段五:专家级

此阶段偏大数据+人工智能及真实项目实战,大数据部分侧重于大数据快速入门

及大数据分析并结合人工智能的一些具体应用,项目主要对时下流行且主流的人工智能/机器学习的项目为主线进行讲解。直接拿阿里天池大赛、Kaggle数据竞赛数据,通过具体的项目实战机器学习、数据分析\挖掘,让学员对之前所学的知识得到充分应用,从而达到融会贯通、举一反三的目的。借助四大商业级项目实战,让学员对推荐系统、大数据下的人工智能应用有一个全面的理解与认识,让学员在工作中有机会冲击数据科学家工作岗位,从而成为这个领域的专家。

人工智能/机器学习开发工程师(资深)、人工智能/机器算法工程师(高级)、数据科学家

阶段六:综合项目演练

项目实战一:基于FP-growth算法实现的新闻网站流量点击分析系统

项目说明:在新闻网站上,一个会用户不断点击和浏览各种新闻报道,最终该用户的这些点击会被记录下来,成为该用户点击的历史记录。而所有用户的点击历史记录,是一个蕴含了巨大价值的数据集。我们可以从各个角度,使用不同的方法来进行有价值的挖掘,并应用到不同的任务中去。本项目就是从用户点击的历史记录中,挖掘频繁项集,以便知道哪些新闻报道是经常关联在一起的。从而为网站的新闻版面排版,新闻推荐等提供科学的参考。主要涉及到FP-growth、FP-tree等算法的综合运用。

项目实战二:基于聚类(Kmeans)算法实现的客户价值分析系统

项目说明:客户价值分析其实就是一个客户分群问题。是以客户为中心,先从客户需求出发,搞清楚客户需要什么,他们有怎么样的一个特征,他们需要什么样的产品,然后我们再回头设计出相应的产品,以满足客户的需求。之所以要进行客户价值分析,就是商家为了避免闭门造车,主观臆断客户需要什么什么什么。随着数据量不断增大,传统的拍脑袋做决定的决策方式,变得越来越过时了。

那具体到我们这个项目呢,我们这个项目的背景是某电信运营商,该运营商需要以客户为中心,按照客户的需求,在对客户特点的了解上,推出不同的资费套餐和营销手段,以便更好地留住现有客户,吸引新的客户。

项目实战四:基于SVD协同过滤算法实现的电影推荐系统

项目说明:协同过滤推荐技术是推荐系统中应用最早和最为成功的技术之一。它一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,系统从而根据这一喜好程度来对目标用户进行推荐。协同过滤最大优点是对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐、电影。

项目实战五:基于OpenCV、随机森林算法实现的图像分类识别系统

项目说明:该系统针对图片分类问题进行分析和讨论,旨在提取图片中的脸部轮廓,利用图像的详细信息对比不同图片中的相似度,从而实现对相册图片的自动分类管理。利用OpenCV中提供的图像检测和图像识别的功能,即使用哈尔小波变换(Haar)和Adaboosting算法进行检测,找出图片中特定区域,进而使用局部二进制模式直方图(LBPH)对人脸进行预测,获得两张图片之间的相似度,依照目录整理后,可达到图片按图片分类的效果。在此基础上设计用户操作界面,实现简易、快捷的操作。软件测试结果表明,该软件图像检测和图像匹配的成功率

较高,为生活提供了便利。

项目实战六:基于NLP自然语言构建的文档自动分类系统

项目说明:随着互联网技术的迅速发展与普及,如何对浩如烟

项目实战七:Kaggle经典AI项目:预测房价系统全程实战

项目实战八:基于RFM模型实现的零售精准营销响应预测系统

业务目标:如何评估客户价值、如何筛选最优质的客户进行精准营销、预测客户的营销响应度涉及算法:

-逻辑回归

-决策树

-支持向量机

-随机森林

项目实战九:天猫、京东电商双11实时商品推荐展示分析平台

项目说明:对于电商、金融、电信、交通等行业,需要对用户购物数据、现金消费数据、上网浏览数据及路况状态数据进行实时统计分析与展示,以便实时商品推荐和货量调度、实时交易风控及实时交通监控和疏导。由于此类数据产生快且多,业务本身需要数据产生之时就要进行实时快速的处理,以便进行展示。当前大数据分析技术框架中,实时流式计算框架Strom和SparkStreaming被逐渐使用,比如电商公司的销售营业额的实时统计(Storm/-JStorm),苏宁顺丰的物流实时追踪监控(SparkStreaming)等都是实时的数据分析处理。

项目实战十:基于Mahout、SparkMlib实现的推荐系统(电影推荐、社交推荐)

项目说明:推荐系统是大数据中最常见和最容易理解的应用之一,最著名的应用恐怕就是亚马逊公司的推荐引擎,其为浏览Amazon.com网站的用户提供个性化的内容。但是不仅仅只有电子商务公司会用推荐引擎为用户提供额外的商品,推荐系统也可以被用在其他行业,以及具有不同的应用中使用,从推荐音乐、活动、产品到约会对象。本课程主要讲述了大数据环境的下推荐系统从零搭建的全过程,通过两个项目实现全程内容贯穿,主要课程目标如下:

目标一:掌握推荐系统的原理

目标二:能够基于mahout、sparkMLlib进行推荐系统的开发

商业项目实战-01:基于AI人脸识别技术实现的“仿美颜相机-自拍坊”企业级应用

项目说明:本项目模仿了:美颜像机自拍加特效的核心功能实现,是一个有料有趣的应用,项目虽小,但功能技术点确非常的多,包括但不限于:人脸识别技术应用、摄像头的控制、图像库的处理,GitHub的使用等。代码略加改造即可应用在实际工业生产项目中,可以讲是一个集趣味,技术,算法与商业应用为一体的课程,具有很高的实用价值!

商业项目实战-02:基于深度学习的CT图像肺结节自动检测技术(深度学习在医疗行业的实践应用\CPU、GPU两套运行环境)

本课程是由一线的深度学习工程师结合实际商业医疗的应用场所景给出的一套解决方案,涉及大量的深度学习技术,并给出了CPU、GPU两套运行环境,具有非常强的学习与商业应用价值!

备注:课程的具体课时安排,老师根据学院和班级情况适当调整。

学习方式:

三种学习方式,可根据学生的实际情况进行灵活选择。三种学习方式价格不等。

THE END
1.24期丨信息学竞赛入门&拓展推荐书单及10大工具网站!建议收藏《信息学奥塞一本通》初赛篇和C++版,这套书比较适合零基础入门使用的,且有专门收录这套书所有习题进行在线评测的一本通题库网站(下文有介绍),初赛篇辅助学员学习信息学竞赛初赛知识。 05 《算法竞赛入门经典(第2版)》 作者:刘汝佳(NOI竞赛https://mp.weixin.qq.com/s?__biz=MzAwNDAzODg3NQ==&mid=2652999200&idx=4&sn=d8d09aa53fc360313c9883df2fe36139&chksm=818b64e26d863d533de572dbe5c816e34a38baa9f219e2a54bf1b1085a1421ab440db82a4f13&scene=27
2.推荐几个算法可视化网站,从此轻松学算法!@程序员大彬: 推荐几个算法可视化网站,从此轻松学算法! 大家好,我是大彬~ 很多初学者在学习数据结构与算法的时候,都会觉得很难,很大一部分是因为数据结构与算法本身比较抽象,不好理解。对于这一点,可以通过一些可视化动画来帮助理解。 下面大彬推荐几个学习数据结构和算法的可视化工具。 Data Structure Vihttps://m.nowcoder.com/feed/main/detail/6ecdab56f00b44bfacf3cb854929059e
3.吴师兄学算法五分钟学算法吴师兄学算法(www.cxyxiaowu.com)提供许多数据结构与算法学习的基础知识, 涵盖 LeetCode 题解、剑指 Offer 题解、数据结构等内容。https://www.cxyxiaowu.com/
4.有哪些高质量的自学网站?网站上还有专业团队为你服务,帮助你接单赚钱。为手中的画作增添变现途径,让我们的爱好,可以更长期地坚持下去。 10、优优课程网(http://uiiiuiii.com/) 学习设计必不可少的网站,设计界的同学都懂。 流传的一句“看行业设计文章到优设,学热门软件教程在优优。”就是最好的证明。 https://www.douban.com/note/767851363/
5.推荐几个正经网站,让你的数据结构和算法学习事半功倍!相信对于大部分程序员来说,数据结构和算法学起来是比较难的,但是它在工作中又是非常的重要,可以说是开发中的一块基石。 所以为了更好的学习和理解数据结构和算法,当时我是趁着双十一搞活动买了几本算法书,打算一鼓作气把它吃透,可想而知有点吃不消。 https://blog.csdn.net/weixin_48655626/article/details/112442781
6.全网最全程序员学习网站汇总,还不赶快收藏摘要:程序员是一个需要不断学习的职业。幸运的是,在这个互联网时代,知识就在那里,等着我们去获取。作为一个“收藏从未中止,学习从未开始”的博主,秉承着好东西不能独享的态度,把收藏的学习网站整理分享出来,希望大家不要学我,肯定要好好学习,天天进步,升职加薪?。好了,下面开始上货,因为博主是个Java程序员, https://www.songma.com/news/txtlist_i66992v.html
7.十大学习网站排名网上学习平台哪个好在线网络学习网站推荐→09 学银在线 0 10 智慧树网 0 学习强国 慕课网 Coursera 可汗学院 我要自学网 国图公开课 终身教育平台 大学资源网 Udacity 十大学习网站榜单中,榜单主要依据AI大数据算法关于学习平台的“用户规模、服务质量、运营状况、用户口碑、知名度与影响力、主题契合程度、网络十大排行情况”等因素综合判断得分系统自动生成https://www.maigoo.com/top/420080.html
8.6个超酷的练习算法,学习编程的网站如果您已经编程了一段时间,想学习一种新的语言,学习一种新的思维方式,那就去运动吧! 总结 在本文中,我分享了6个超酷的网站来练习算法和学习编程! 我个人认为您不需要学习太多,如果想在面试之前进行练习,请访问Skilled / Hackerrank / Leetcode。 或者,如果您需要学习新的语言,请选择运动。https://news.51cto.com/art/202006/618315.htm
9.通常从哪里获取最新的编程技术资讯和教程?Stack Overflow:全球最大的程序员专业问答网站,涵盖编程语言、软件开发工具、算法等多方面的问题和答案,https://www.zhihu.com/question/5392002679/answer/56183345264
10.九章算法九章算法致力于让顶尖的工程师在线传授最优质的计算机课程,帮助更多程序员找到好工作http://jiuzhang.com/
11.Pytorch深度学习实战教程(三):UNet模型训练好了,任务介绍完毕,开始准备训练模型。 三、UNet训练 想要训练一个深度学习模型,可以简单分为三个步骤: 数据加载:数据怎么加载,标签怎么定义,用什么数据增强方法,都是这一步进行。 模型选择:模型我们已经准备好了,就是该系列上篇文章讲到的 UNet 网络。 算法选择:算法选择也就是我们选什么 loss ,用什么优化算法。https://cuijiahua.com/blog/2020/03/dl-16.html
12.有哪些学习算法的网站推荐?推荐的讲解算法的网站、好博客:讲解、代码格式、图表都很规范,覆盖广Matrix67 的一些算法讲解类经典文章,平易近人BYVoid 的博客,计算机科学标签范浩强的博客(曾经)https://www.jianshu.com/p/06ff13b234e3
13.如何选择机器学习算法统计学和机器学习中的线性度表示数据集中的某个变量与常数之间存在线性关系。 例如,线性分类算法假设直线(或其更高维的模拟)可以将类分离。 许多机器学习算法都使用线性。 在 Azure 机器学习设计器中,这些算法包括: 多类逻辑回归 双类逻辑回归 支持向量机 https://docs.microsoft.com/zh-cn/azure/machine-learning/studio/algorithm-choice
14.2020年深度学习算法工程师面经(微软阿里商汤滴滴华为简单分为深度学习、机器学习基础、图像处理基础、数学基础、算法基础、程序设计语言、模型部署、HR面试以及与我本人简历相关的目标检测、属性识别、Kaggle及天池的比赛、创新想法等几个部分介绍。可能开始会有重叠或者分类不恰当,后面会逐渐更新完善。其中第一篇先介绍到HR面试,第二篇介绍个人相关的项目和比赛部分。https://maimai.cn/article/detail?fid=1514590373&efid=Oph3033j5Qs70xHZdz0sGA
15.相由心生?面部算法分析能否窥测你的内心?思想市场澎湃新闻而批评者认为,被建构起来的面部算法分析实际上不过是一种脆弱的、文化构建的假设,这是最令人担忧的。德布林在一封电子邮件中说:“社会心理学也有严肃的问题,它往往受到英语母语使用者、异性恋者、白人意识的主导,这无疑推动了这类研究。我无法想象,如果整个渠道的某些节点(同事、伦理委员会、编辑、评论家等)有更多不https://www.thepaper.cn/newsDetail_forward_1864416
16.人工智能机器学习常用算法总结及各个常用算法精确率对比相关技巧学过概率的同学一定都知道贝叶斯定理,这个在250多年前发明的算法,在信息领域内有着无与伦比的地位。贝叶斯分类是一系列分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。朴素贝叶斯算法(Naive Bayesian) 是其中应用最为广泛的分类算法之一。朴素贝叶斯分类器基于一个简单的假定:给定目标值时属性之间相https://www.jb51.net/article/182909.htm
17.AlphaZero加强版AlphaTensor问世,发现史上最快矩阵乘法算法医学图像的模式可以通过ML技术识别,允许放射科医生根据放射信息做出明智的决定,如基本放射照相术、计算机断层扫描(CT)、MRI、正电子发射断层扫描(PET)图像和放射学报告。例如研究人员提出了一种序列增强学习技术,用于在乳房X光片中使用SVM检测微钙化(MC)簇时提高性能等。ML和模式识别算法对大脑成像有重大影响,从长远来看https://www.medsci.cn/article/show_article.do?id=97c6e419443f
18.英语词汇软件哪个好?英语词汇大全词汇app下载英语词汇大全,集合了扇贝单词、网易有道词典、星火简词汇、乐词、英语四级词汇、海词词典、词管家等众多单词学习软件,拥有海量的词汇书、权威的例句、有趣的智慧词根,提供了多种模式的词汇记忆方法,其中包括情节、游戏、串词、歌曲等方式,智能启发用户记词汇流程,让记词汇不再变得枯燥,还可以定制适合你的学习计划,更好http://www.downcc.com/k/yingyucihui/
19.图分析与学习算法自动驾驶技术……这两位人大学子,获奖她曾获研究生国家奖学金、中国石油奖学金、一等学业奖学金等,入选中国人民大学“拔尖创新人才培育资助计划”。其研究关注大规模图分析与学习算法的可扩展性问题。她在计算机理论研究,特别是图分析和学习算法方向,取得了突破性的成果。其成果有望在搜索等业务领域落地,发挥重大作用。https://t.m.youth.cn/transfer/index/url/tech.youth.cn/wzlb/202201/t20220129_13411740.htm
20.常见用户行为分析模型解析MySecretRainbow预测用户分群——通过机器学习算法预测事件概率 互联网金融产品常常会用到预测用户分群的功能。互联网金融客户按照风险投资偏好这一属性分为保守、稳健和激进,按照投资行为可分为已投资和未投资。 运营人员可以根据这一属性和行为将满足某种条件的用户群体提取出来,譬如激进型但未投资的这群用户,然后分析这一群体的行为特http://www.mysecretrainbow.com/blog/12611.html
21.大数据基础术语精粹来袭由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。http://www.mudan.gov.cn/2c908084831c4eb30183205259ac001f/2c908084831c4eb3018320df837d0020/1669185201282129920.html
22.每日热点1102Nature子刊:深度学习算法可以在显微镜图像中识别出各种细菌 BMJ:人工甜味剂安全性再添新忧!超10万人研究发现,饮食中总甜味剂摄入量高,与心血管疾病和脑血管疾病风险增加9%和18%相关 舆情信息 新冠病毒疫苗接种情况 世卫组织:黎巴嫩霍乱疫情迅速蔓延 “个人碳账户”还应更多些 https://sccdc.cn/Article/View?id=30661
23.和数据滥用说再见,“少样本学习”能否拯救推荐系统?如果用户很懒,或者不愿意让系统知道自己的个人信息,推荐系统还可以使用热度模型,基于统计分析推荐一些大部分人都会感兴趣的热点信息。虽然很容易让平台调性显得有点low,但从概率学角度看,说不定就正好撞到用户心口上了呢。 比如一直强调算法推荐的今日头条,在冷启动状态就采用了这种做法,向新用户推荐的大多是“新娘给https://www.tmtpost.com/3559257.html