最近有很多同学问我,零基础学习智能的路线是怎么样的?
废话不多说,先上张图镇楼,看看零基础学习智能的路线有哪些向,它们之间有什么关系和区别,各自需要学习哪些东。
在这个圈技术类中,作岗位主要有以下三个向:
下逐说明下。
如果你是来医疗业、业、零售和融等业,那么恭喜你,今年2023年共投资了155起融资,你可以把数据分析、机器学习作为个岗位结合到以上业中进就业/提升,从加薪。
如说,在医疗业随机森林算法进预测肿瘤癌症,在业中SVM算法进异常值分析/零件缺陷,在融业Python的Pandas分析搜狐证券,并机器学习的树模型建模。
具体要掌握哪些技能/知识/理论/项呢:
总结下,数据分析师/机器学习程师都是在做本分析、表格建模,涉及业、业、零售和融等业(互联向),最多的作就是在研究户、研究流量、研究产品等
分析户、流量和产品到的技术主要以Python数据分析、机器学习和统计学三技术栈为主,也有少部分的Excel、MySQL和Tableau等具。
数据分析师/机器学习程师,相对开发向,对编程的要求要低些(只是相对,部分产品的研发对数据分析师要求并不低),甚我过不少公司的数据分析师对智能的算法所知。在这种情况下,如果除了基本的数据分析的功底以外,对智能技术有所了解,然会是你试这些岗位时的加分项。
然语处理NLP向,这是人工智能AI两技术向之。
这个向主要涉及到软件机器对话/问答系统、翻译软件、物体命名分析等作,涉及GPT分析、Transformer、BRET等技术。因为经常都是与本打交道,所以久久之科的同学常适合学NLP向,尤其是来互联的业的同学。
这个向的特点是:需要耐得住寂寞。
像歌、百度、字节等公司智能实验室的掌,业界知名的李开复、陆奇这些物,他们已经深谙漏洞挖掘的奥义,并将这绝技融会贯通,做个梦都能想到新的玩法。不过像这样的天才实在是少之少,绝多数都法企及。
如果说程序员是苦逼的话,那然语处理NLP就是苦逼Plus
在这张图路线图中,共划分了15个章节,但并不是说你得学完全部才能上作,对于些初级岗位,学到第第章个阶段就矣。
下的内容,定要结合上这张图看效果才最好,建议在浏览器中新建个tab,打开那张图,结合着看。
第个阶段——器时代,针对的是纯新刚刚场。在这个阶段,主要是打基础,需要学习的有4部分内容:
1、数据分析思维与业务流程
当年数据分析包含智能、机器学习,数据分析思维是试和板对话的重中之重,逻辑树、5W2H、SWOT等数据分析法是互联公司中必知必会的,还有掌握5个流程的细节,从明确标、数据清洗、数据分析、数据展现到数据分析报告都要全位掌握。
除此之外,学习在机器学习上进本预测、表格分析等预测,要先学会Excel分析,为接下来学习表格建模做准备作。
智能,必然要与算法经常打交道,我看到很多新上来就跟着些培训班学习算法,学的云雾的。连基本的标函数的概念都没建起来,就急着学算法,这属于还没学会路就去学跑步,本末倒置了
在基础阶段,主要以使为主,学习数据分析的法论、Excel、分析5步流程,对数据分析有个基本的认知。
2、MySQL数据分析实战
数据分析中,MySQL肯定是常重要的存在。作为基础阶段,这节主要从宏观上学习多表查询和开窗函数,不是死扣某个sql的某些字段意义。先理解MySQL各存储引擎原理与特点,继掌握SQL多表级查询、开窗函数,然后掌握数据库性能调优策略,使SQL进数据清洗与数据规范化。
3、数据分析必学编程语-Python
Python现在是职场必会的编程语,同时也是数据分析必须第语,在这个阶段,具备Python编程思维与编程能,使Python做动化办公脚本,使Python做爬程序,熟练使Python做更复杂的数据分析与可视化代替具。具体包括:
4、数据分析必备理论基础-统计学知识
度过了器时代,你已经储备了些数据分析的基础知识:Python语编程,统计学知识,数据库mysql等初识,但这距离做智能还不够,在第个铜阶段,你还需要再进步学习基础,在第阶段之上,难度会开始慢慢上升。
这阶段需要学习的知识有:
1、线性模型
在前的器时代,咱们初步接触了数据分析,了解了数据分析法论的基本原理。不过那时候是偏基础的,在这个进阶的阶段,你要开始接触机器学习的内容了。
先从常的两主流算法出发,学习算法那理论和代码建模的基本知识,随后引出互联公司喜爱的机器学习项,从线性理论过渡到后来的全连接神经络MLP等深度学习的算法技术,从专业的度上说,线性回归、逻辑回归和持向量机等算法到现如今,只需要掌握这3个算法的理论,不需要掌握代码。
那么如何掌握这3个算法的线性模型呢?
掌握这3个公式,就是精华,其他的公式跟你没关系。
2、树模型
学习机器学习的线性理论,接下来就是在量化交易、融控、信号处理等场景中,数据只要是表格型的,就到决策树、随机森林和XGBoost算法建模(这是经验之谈)。
由于学习的的不同,所以在学习法上和普通的机器学习算法就有所不同了。在这咱们学习下算法推导中,树模型(决策树/随机森林/XGBoost)显然没有前的线模型难,当然如果你有兴趣,学的更深当然更好。
现在进第三个阶段——银时代,激动的时刻就要到来了,在这个阶段,我们开始全学习真正的机器视觉CV了,前两个阶段打下的基础,在这个阶段,也将派上场。
1、CNN卷积神经网络/残差网络
有了前的Python编程和机器学习的基础,可以来正式学习机器视觉CV了。机器视觉CV领域内典型的场景:图像分割、OpenCV传统视觉、图像分类、标检测、动驾驶等等,每个都需要详细学习,边学习理论,边动实践。
作为个下的过来,在学习深度学习的神经络中,重点掌握理论的法和写代码的法,下我贴2张图,已经经历过学习检验,务必记下来。
2、目标检测系列算法
2023年4,中国NLP赛道累计投融资事件数达到54起。其中,融、医疗、零售、政务为NLP赛道Top4应领域,占分别达到42.6%、35.2%、27.8%与24.1%。从涉及的应产品来看,主要包括智能档处理(IDP)、机器流程动化(RPA/IPA)、专搜索引擎、本成、机器翻译、垂直领域认知智能产品(如医疗CDSS、政务舆情监测系统)等。其中RPA商占最,RPA产品集成NLP技术可在动化端到端流程上让机器做出决策,如票据处理、合同分析等,在融、零售、互联多业领域应阔。从融资事件轮次分布来看,C轮以前的融资事件占达到66.7%,多集中在早期,产业仍处于快速发展阶段。