浙江大学数学科学院继续教育中心

《人工智能-机器学习开发工程师》项目

人工智能开发工程师学习计划,全程实战案例,从机器学习原理到推荐系统实现,从深度学习入门到图像语义分割及写诗机器人,再到专属GPU云平台上的四大工业级实战项目。三个月完美掌握人工智能开发工程师的必备技能。实现从【程序猿】向人工智能/机器学习工程师的华丽转型。

适用人群

理工科0基础,逻辑思维能力强的小白

数据分析师

数学/统计学/物理学专业人员

豪华讲师团队

宣晓华

华院数据董事长兼CEO

加州大学伯克利分校数学博士

复旦大数据学院特聘教授

中国工业和应用数学学会副理事长

上海大数据联盟副理事长

段勇

前杭州数云联合创始人兼CTO

前华院数据大数据挖掘技术总监

上海连尚网络(WiFi万能钥匙)AI技术和应用专家

杨晶晶

华院数据首席人工智能专家、计算机硕士

张帅

华院数据人工智能专家、人工智能博士

五层级能力训练示意图

我们的课程侧重于第2、3、4层次人才的培养,也是人工智能领域未来需求量最大的应用工程类层级的人才培养,课程侧重于快速上手、代码实现、工程应用

强大的课程体系

《人工智能-机器学习开发工程师》课程体系大纲

阶段一、代码级

Python是非常流行的数据科学和机器学习语言,是通向人工智能必须要过的第一关。通过本阶段的学习,学生将掌握python的编程语法和常用技巧,并系统学习python中用于数据分析和机器学习的常用工具,为后续进一步学习人工智能/机器学习更高级的内容打下坚实且必要的基础。

学完后能达到的水平:针对Python数据分析师工作岗位需求打造

重要程度:

难度系数:

阶段二、应用级

此阶段侧重于机器学习的算法基础了解及算法的Python代码实现。通过对基本的数理统计知识的学习,了解机器学习必须掌握的算法原理及Python代码实现,达到利用Pyhton代码结合算法解决实际人工智能/机器学习业务分析预测的目的。

学完后胜任的工作岗位:数据挖掘/分析师、人工智能/机器学习开发工程师(初级)

阶段三、工程级

此阶段侧重于对人工智能/机器学习工作流程中最重要的几个环节,通过对数据准备、数据特征、数据模型的深入介绍及算法优化,结合深度学习和具体的经典案例,让学员对于机器学习上升到工程应用的级别,能够进行基本的算法评估与优化。

学完后胜任的工作岗位:

人工智能/机器学习开发工程师(中级)、人工智能/机器算法工程师(初级)

阶段四:算法级

此阶段会让学员对人工智能/机器学习算法有更进一步的深入理解,主要涉及深

机器学习、深度学习的代码实现。

人工智能/机器学习开发工程师(高级)、人工智能/机器算法工程师(中级)

深度学习应用开发工程师、人脸识别应用开发工程师

阶段五:专家级

此阶段偏大数据+人工智能及真实项目实战,大数据部分侧重于大数据快速入门

及大数据分析并结合人工智能的一些具体应用,项目主要对时下流行且主流的人工智能/机器学习的项目为主线进行讲解。直接拿阿里天池大赛、Kaggle数据竞赛数据,通过具体的项目实战机器学习、数据分析\挖掘,让学员对之前所学的知识得到充分应用,从而达到融会贯通、举一反三的目的。借助四大商业级项目实战,让学员对推荐系统、大数据下的人工智能应用有一个全面的理解与认识,让学员在工作中有机会冲击数据科学家工作岗位,从而成为这个领域的专家。

人工智能/机器学习开发工程师(资深)、人工智能/机器算法工程师(高级)、数据科学家

阶段六:综合项目演练

项目实战一:基于FP-growth算法实现的新闻网站流量点击分析系统

项目说明:在新闻网站上,一个会用户不断点击和浏览各种新闻报道,最终该用户的这些点击会被记录下来,成为该用户点击的历史记录。而所有用户的点击历史记录,是一个蕴含了巨大价值的数据集。我们可以从各个角度,使用不同的方法来进行有价值的挖掘,并应用到不同的任务中去。本项目就是从用户点击的历史记录中,挖掘频繁项集,以便知道哪些新闻报道是经常关联在一起的。从而为网站的新闻版面排版,新闻推荐等提供科学的参考。主要涉及到FP-growth、FP-tree等算法的综合运用。

项目实战二:基于聚类(Kmeans)算法实现的客户价值分析系统

项目说明:客户价值分析其实就是一个客户分群问题。是以客户为中心,先从客户需求出发,搞清楚客户需要什么,他们有怎么样的一个特征,他们需要什么样的产品,然后我们再回头设计出相应的产品,以满足客户的需求。之所以要进行客户价值分析,就是商家为了避免闭门造车,主观臆断客户需要什么什么什么。随着数据量不断增大,传统的拍脑袋做决定的决策方式,变得越来越过时了。

那具体到我们这个项目呢,我们这个项目的背景是某电信运营商,该运营商需要以客户为中心,按照客户的需求,在对客户特点的了解上,推出不同的资费套餐和营销手段,以便更好地留住现有客户,吸引新的客户。

项目实战四:基于SVD协同过滤算法实现的电影推荐系统

项目说明:协同过滤推荐技术是推荐系统中应用最早和最为成功的技术之一。它一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,系统从而根据这一喜好程度来对目标用户进行推荐。协同过滤最大优点是对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐、电影。

项目实战五:基于OpenCV、随机森林算法实现的图像分类识别系统

项目说明:该系统针对图片分类问题进行分析和讨论,旨在提取图片中的脸部轮廓,利用图像的详细信息对比不同图片中的相似度,从而实现对相册图片的自动分类管理。利用OpenCV中提供的图像检测和图像识别的功能,即使用哈尔小波变换(Haar)和Adaboosting算法进行检测,找出图片中特定区域,进而使用局部二进制模式直方图(LBPH)对人脸进行预测,获得两张图片之间的相似度,依照目录整理后,可达到图片按图片分类的效果。在此基础上设计用户操作界面,实现简易、快捷的操作。软件测试结果表明,该软件图像检测和图像匹配的成功率

较高,为生活提供了便利。

项目实战六:基于NLP自然语言构建的文档自动分类系统

项目说明:随着互联网技术的迅速发展与普及,如何对浩如烟

项目实战七:Kaggle经典AI项目:预测房价系统全程实战

项目实战八:基于RFM模型实现的零售精准营销响应预测系统

业务目标:如何评估客户价值、如何筛选最优质的客户进行精准营销、预测客户的营销响应度涉及算法:

-逻辑回归

-决策树

-支持向量机

-随机森林

项目实战九:天猫、京东电商双11实时商品推荐展示分析平台

项目说明:对于电商、金融、电信、交通等行业,需要对用户购物数据、现金消费数据、上网浏览数据及路况状态数据进行实时统计分析与展示,以便实时商品推荐和货量调度、实时交易风控及实时交通监控和疏导。由于此类数据产生快且多,业务本身需要数据产生之时就要进行实时快速的处理,以便进行展示。当前大数据分析技术框架中,实时流式计算框架Strom和SparkStreaming被逐渐使用,比如电商公司的销售营业额的实时统计(Storm/-JStorm),苏宁顺丰的物流实时追踪监控(SparkStreaming)等都是实时的数据分析处理。

项目实战十:基于Mahout、SparkMlib实现的推荐系统(电影推荐、社交推荐)

项目说明:推荐系统是大数据中最常见和最容易理解的应用之一,最著名的应用恐怕就是亚马逊公司的推荐引擎,其为浏览Amazon.com网站的用户提供个性化的内容。但是不仅仅只有电子商务公司会用推荐引擎为用户提供额外的商品,推荐系统也可以被用在其他行业,以及具有不同的应用中使用,从推荐音乐、活动、产品到约会对象。本课程主要讲述了大数据环境的下推荐系统从零搭建的全过程,通过两个项目实现全程内容贯穿,主要课程目标如下:

目标一:掌握推荐系统的原理

目标二:能够基于mahout、sparkMLlib进行推荐系统的开发

商业项目实战-01:基于AI人脸识别技术实现的“仿美颜相机-自拍坊”企业级应用

项目说明:本项目模仿了:美颜像机自拍加特效的核心功能实现,是一个有料有趣的应用,项目虽小,但功能技术点确非常的多,包括但不限于:人脸识别技术应用、摄像头的控制、图像库的处理,GitHub的使用等。代码略加改造即可应用在实际工业生产项目中,可以讲是一个集趣味,技术,算法与商业应用为一体的课程,具有很高的实用价值!

商业项目实战-02:基于深度学习的CT图像肺结节自动检测技术(深度学习在医疗行业的实践应用\CPU、GPU两套运行环境)

本课程是由一线的深度学习工程师结合实际商业医疗的应用场所景给出的一套解决方案,涉及大量的深度学习技术,并给出了CPU、GPU两套运行环境,具有非常强的学习与商业应用价值!

备注:课程的具体课时安排,老师根据学院和班级情况适当调整。

学习方式:

三种学习方式,可根据学生的实际情况进行灵活选择。三种学习方式价格不等。

THE END
1.算法学习必备网站,不定时更新,建议先收藏。labuladong刷题网站算法学习必备网站,不定时更新,建议先收藏。 目录 一、labuladong 的算法笔记 二、Hello 算法 三、代码随想录 四、力扣 leetcode 五、牛客网nowcoder 一、labuladong 的算法笔记 labuladong 的算法笔记 | labuladong 的算法笔记labuladong 的算法笔记,致力于把算法讲清楚,打造最丝滑的刷题体验。https://blog.csdn.net/zhangchb/article/details/143163269
2.基于商品的推荐算法java代码python商品推荐算法基于商品的推荐算法java代码 python商品推荐算法 这一节主要涉及到的数据挖掘算法是关联规则及Apriori算法。 由此展开电商网站数据分析模型的构建和电商网站商品自动推荐的实现,并扩展到协同过滤算法。 关联规则最有名的故事就是啤酒与尿布的故事,非常有效地说明了关联规则在知识发现和数据挖掘中起的作用和意义。https://blog.51cto.com/u_16213668/11631942
3.机器学习从零实现来理解机器学习算法腾讯云开发者社区如果它是一本书、GitHub库、代码下载或者类似的,如果代码不工作,一个好的常规策略是寻找相关的勘误表。有时这些问题已经在书上或作者的网站上修正了。一些简单的谷歌搜索就能找到它们。 2) 代码不规范描述 当从零开始实现算法时,我认为第二个糟糕的绊脚石是提供的代码描述很糟糕。 https://cloud.tencent.com/developer/article/1044510
4.分享Matlab代码教程和数学建模知识的专业平台Matlab源码网是一个专注于分享Matlab代码、教程和数学建模相关知识的专业平台。我们提供丰富的Matlab学习资源,包括实用的源码、详细的教程以及数学建模方面的知识,旨在帮助用户快速学习和应用Matlab,提升数学建模能力。无论您是初学者还是专业人士,Matlab源码网都是您学https://www.matlabcode.cn/
5.Horace/代码随想录电脑端还看不到留言,大家可以在公众号「代码随想录」,左下角有「算法汇总」,这是手机版刷题攻略,看完就会发现有很多录友(代码随想录的朋友们)在文章下留言打卡,这份刷题顺序和题解已经陪伴了上万录友了,同时也说明文章的质量是经过上万人的考验! https://gitee.com/Time_Charmer/leetcode-master
6.GitHublabuladong/fucking我的算法网站、所有配套插件都集成了一个算法可视化工具,可以对数据结构和递归过程进行可视化,大幅降低理解算法的难度。几乎每道题目的解法代码都有对应的可视化面板,具体参见下方介绍。 二、学习网站 内容当然是我的系列算法教程中最核心的部分,我的算法教程都发布在网站labuladong.online上,相信你会未来会在这里花费大https://github.com/labuladong/fucking-algorithm
7.ModelArts使用自定义镜像创建算法ModelArts用户指南训练过程中,基于预置框架的算法需要从OBS桶或者数据集中获取数据进行模型训练,训练产生的输出结果也需要存储至OBS桶中。用户的算法代码中需解析输入输出参数实现ModelArts后台与OBS的数据交互,用户可以参考开发自定义脚本完成适配ModelArts训练的代码开发。 创建基于预置框架的算法时,用户需要配置算法代码中定义的输入输出参数https://ecloud.10086.cn/op-help-center/doc/article/78090
8.解开算法“黑箱”≠披露源代码应提升人工智能透明度解开算法“黑箱”≠披露源代码 应提升人工智能透明度 最近聊天机器人很火,这类人工智能产品能够理解人类语言与互动者进行对话,还能根据聊天上下文进行互动等,其中佼佼者甚至能回答人类提出的各种远超以往难度的复杂问题,因此聊天机器人备受追捧,但也有评论对看上去特别智能的聊天机器人提出了担忧:当前基于大数据学习和给定https://wxb.xzdw.gov.cn/xxh/xxhgzdt/202302/t20230225_321489.html
9.马斯克拟开放推特算法源代码,会改变社交平台游戏规则吗自由谈Musk宣称有意开放Twitter算法的原始代码,并指出“开放算法原始码能够增加互信”,不但可以让人们知道哪里出了问题,也能让歧视或仇恨言论的制造者曝光。不搞暗箱操作,不搞算法操控,一切公开透明,如果真能做到,确是新的玩法。 本文首发于南方周末 未经授权 不得转载 https://static.nfapp.southcn.com/content/202205/18/c6506946.html
10.谷歌大脑提出AutoML安装好Bazel后,将代码下载到本地,运行其中的demo程序: git clone https://github.com/google-research/google-research.git cd google-research/automl_zero ./run_demo.sh 这个脚本在10个线性任务上运行进化搜索。每次实验后,它都会评估在100个新的线性任务中发现的最佳算法。一旦算法的适应度大于0.9999,就选择该https://m.thepaper.cn/wap/resource/v3/jsp/newsDetail_forward_6453837