算法的基本原理——天才AI

众所周知,大数据平台只是提供了数据获取、存储、计算、应用的技术方案,真正挖掘这些数据之间的关系让数据发挥价值的是各种机器学习算法。

如今,算法已经成为许多数字平台的核心资产。许多数字平台会追踪用户的喜好和点击的内容,将这些用户偏好集中起来之后,向同样具有这类偏好特征的用户做出所谓的“个性化定制”推送。

今天小亿就来带着大家彻底的了解什么是算法?背后的基本原理是怎样的?除了应用在智能推荐当中,还可以应用在哪些其他领域?

一、什么是算法?

这里的算法指的是机器学习算法,即计算机模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的过程。当然,算法需要以数据结构为基础。

换句话说,机器学习算法在大数据的基础上确立算法,通过不断优化算法,提升处理数据的能力。而算法优化的过程,则是不断犯有益的错误的过程,即以明确、简单又有效的新算法淘汰和过滤旧算法。

与此同时,算法也可以理解为为了解决某个问题的固定化计算方法与步骤,具体拆解为以下几个方面:

(1)目的:为了解决某个/某类问题,需要在这之前了解到背后的业务背景、关联场景;

(2)方法:通过计算来实现,也就意味着需要具备具体的、可量化的信息输入,且可计算、而非不可执行的概念体;

(3)结论:是否能够解决这个问题,效果如何,最终必须得有一个产出物。在算法之外,还有几层扩展;

(4)决策:根据一个或者多个结论进行判断,这个过程是不是符合预期,如何调整优化,是否可直接应用于业务;

(5)应用拓展:除了解决最初的那个问题外,还有哪些同质类型的问题也可以得到解决,也就是场景的拓展。

二、机器学习的分类:监督学习和无监督学习

前面我们提到了机器学习,机器学习主要分为:监督学习和无监督学习。而要掌握机器学习,主要就是学习解决这两类问题的基本思路,主要是以下三步:

①把现实场景中的问题抽象成相应的数学模型,并知道在这个抽象过程中,数据模型有怎样的假设;

②利用数据工具,对相应的数学模型参数进行求解;

③根据实际问题出评估方案,对应用的教学模型进行评估,看是否解决了实际问题。

这三步就是我们学习监督学习和无监督学习,乃至所有的机器学习算法核心思路。机器学习中不同模型、不同算法都是围绕这三步来展开的。

1.监督学习

监督学习是指通过外部的响应变量来指导模型学习我们关心的任务,并达到我们需要的目的。这也就是“监督学习”中“监督”两字的由来。也就是说,监督学习的最终目标,是使模型可以更准确地对我们所需要的响应变量建模。

比如,我们希望通过一系列特征来预测某个地区的房屋销售价格,希望预测电影的票房,或者希望预测用户可能购买的商品。这里的“销售价格”、“电影票房”以及“可能购买的商品”都是监督学习中的响应变量。

2.无监督学习

而通常情况下,无监督学习并没有明显的响应变量。无监督学习的核心,往往是希望发现数据内部的潜在结构和规律,为我们进行下一步决策提供参考。

典型的无监督学习就是希望能够利用数据特征来把数据分组,机器学习语境下叫做“聚类”。不同的应用场景,聚类又有很多变种,比如认为某个数据点属于一个类别,或者认为某个数据点同时属于好几个类型,只是属于每个类型的概率不同等等。

除此以外,无监督学习的另外一个作用是为监督学习提供更加有力的特征。通常情况下,无监督学习能够挖掘出数据内部的结构,而这些结构可能会比我们提供的数据特征更能抓住数据的本质联系,因为监督学习中往往也需要无监督学习来进行辅助,这时会有另外一个名字叫“半监督学习”

三、算法背后的基本原理是怎样的?

1.监督学习的基本原理

监督学习的基础是三类模型:线性模型、决策树模型、神经网络模型。掌握这三类模型就掌握了监督学习的主干,利用监督学习来解决的问题,占所有机器学习或者人工智能任务的绝大多数。这些监督学习模型又可以细分为主要处理两类问题:分类问题和回归问题。

分类问题的核心是如何利用模型来判别一个数据点的类别,这个类别一般是离散的,比如两类或者多类。回归问题的核心则是利用模型来输出一个预测的数值,这个数值一般是一个实数,是连续的。这里我们以线性回归模型为例来进行说明,线索回归模型是所有回归模型中最简单也是最核心的一个模型。

(1)第一步:把现实场景中的问题抽象成相应的数学模型

例如,线索回归认为现实场景中的响应变量(比如房价、票房等)和数据特征之间存在线性关系,而线性回归的数学假设有两个部分:

①响应变量的预测值是数据特征的线性变换。这里的参数是一组系数。而预测值是系数和数据特征的线性组合;

②响应变量的预测值和真实值之间有一个误差。这个误差服从一个正态(高斯)分布,分布的期望值是0,方差是σ的平方。

(2)第二步:对相应的数学模型参数进行求解

对于同一个模型而言,可以用不同的算法来求解模型的参数,这是机器学习的一个核心特点。比如在教科书中一般会介绍线性回归的解析解。线性回归的解析解虽然简单优美,但是在现实计算中一般不直接采用,因为需要对矩阵进行逆运算,而矩阵求逆运算量很大。解析解主要用于各种理论分析中。

线性回归的参数还可以用数值计算的办法,比如梯度下降的方法求得近似结果。然而梯度下降需要对所有的数据点进行扫描。当数据量很多的时候,梯度下降会变得很慢。于是随机梯度下降算法就应运而生。随机梯度下降并不需要对所有的数据点扫描后才对参数进行更新,而可以对一部分数据,有时甚至是一个数据点进行更新。

(3)第三步:评估线性回归模型

由于线性回归是对问题的响应变量进行一个实数预测。那么,最简单的评估方式就是看这个预测值和真实值之间的绝对误差。如果对于每一个数据点我们都可以计算这么一个误差,那么对于所有的数据点而言,我们就可以计算一个平均误差。

2.无监督学习的基本原理

在前文中,我们提到无监督学习的主要目的是挖掘出数据内在的联系。但这里需要注意,不同的无监督学习方法对数据内部的结构有不同的假设,因此无监督学习不同模型之间常常有很大的差别。在众多无监督学习模型中,聚类模型无疑是重要的代表,而聚类模型中也有很多种类,这里我们以最常见的K均值算法(K-means)来进行说明:

K均值算法认为数据由K个类别组成。每个类别内部的数据相距比较近,而距离所有其他类别中的数据都比较遥远。因此在K均值算法中,数据到一个类别的距离被定义为到这个类别的平均点的距离。这也是K均值名字的由来。而距离函数则采用了欧几里得距离,来衡量两个数据点之间的远近。

直接求解K均值的目标函数是一个NP难的问题。于是大多数现有的方法都是用迭代的贪心算法来求解。

一直以来,对聚类问题、对无监督学习任务的评估都是机器学习的一个难点。无监督学习没有一个真正的目标,或者是我们之前提到的响应变量,因此无法真正客观地衡量模型或者算法的好坏。

对于K均值算法而言,比较简单的衡量指标就是,看所有类别内部的数据点的平均距离和类别两两之间的所有点的平均距离的大小。如果聚类成功,则类别内部的数据点会相距较近,而类别两两之间的所有点的平均距离则比较远。

四、哪些场景下需要用到机器学习算法?

1.供需匹配的问题

在过去的市场经济环境中,无论是B2C、B2B还是其他,我们去建立用户画像做精准营销、做好推荐系统实现千人千面、对用户进行分层分类打标签、给用户的评价信息分情绪好坏等等,都是为了更好的去做供需管理,例如网约车就是双边的供需管理。

供需管理,即谁可以找谁消费到一件相对比较合适的东西(内容、物品、信息、线索、商机),在这个过程中还可能需要通过哪几个谁才能打通彼此之间的联系。早期数据不大,通过人工的方式能解决,但如今数据量巨大的供需平台就需要利用算法来进行更高效的匹配。供需匹配过程中涉及的算法,基本都是有监督算法,不论是人群分类、商品召回、需求匹配,都可以通过过去的经验进行一个初步标签建立,然后逐步去对划分的准确性进行校验和优化。

与此同时,在供需的某些场景过程中会并存很多涉及物联网的知识,譬如物流调度、配送匹配、路线优化、仓库建设等等供应链优化方面的事情,这些场景下除了算法外,还需要去了解下运筹学的内容。

2.异常识别和诊断

异常检测在金融领域应用比较广泛,主要的场景就是风控。如图所示:

3.排序

排序之所以单拎出来,它的应用场景其实有一定的局限性,但是怎么做好排序,客观、合理,却是一个值得去考究的事情。常见的排序应用场景有热点榜单、搜索排序、推荐排序等。

4.预测

数值预测与分类预测都属于预测场景。销售预测、股票预测、流量预测,这些都是常见的预测场景。

5.知识图谱

2012年的时候Google推出了一个叫KnowledgeGraph的产品,能够直观的看到词和其背后知识的关系。很多大公司都已经在知识图谱的建设上进行布局了,知识图谱最早的应用是提升搜索引擎的能力,随后在辅助智能问答、自然语言理解、大数据分析、推荐计算、物联网设备互联、可解释性人工智能等多个方面展现出丰富的应用价值,如图所示,这几年推广比较成功的应该是AI辅助司法进行案件判决。

五、机器学习算法应用于业务的案例

我们最近常听到的一个词叫“大数据杀熟”,应该是算法在业务上非常常用的一种应用场景。通常来说,算法的产出物有两种,第一种是算法产出的结果(分群、分类、预测值),第二种是算法产出的规则。

1.产出结果(分群、分类、预测值)

最终结合大数据技术对罪犯进行预警监控,降低警力成本,减轻监狱民警的工作强度,提高了技防的科学性、精准性,让整个安防系统更加完善。

2.产出规则

最终为各业务部门提供统一的数据共享交换服务的同时,通过机器学习算法,智能筛选可能有问题的监管对象,为各类监管工作提供预测预警数据依据,在有限的人力下覆盖更大的监管范围,深度挖掘数据特征,提高政府监管效率。

THE END
1.天才基本法视频在线观看电视剧天才基本法2022 导演:沈严 主演:雷佳音张子枫张新成刘琳 简介:讲述了少女林朝夕由于长期仰望父亲老林和初恋裴之两位数学天才,从而悄悄掩埋了内心对于数学的热爱,直到经历了双时空之旅,她迸发出了超越想象的力量。在老林的引领以详细> 1 2 3 http://client.so.pps.tv/so/q_%E5%A4%A9%E6%89%8D%E5%9F%BA%E6%9C%AC%E6%B3%95
2.《天才基本法》全集在线观看电视剧大全天才基本法全34集 无 导演:沈严 主演:雷佳音 / 张子枫 / 张新成 / 刘琳 / 王圣迪 / 耿乐 / 王骁 / 王宥钧 / 胡连馨 / 是安 / 林子烨.. 类型:2022年地区:大陆语言:国语 更新:2023-12-16 11:55 简介: 该剧根据长洱同名小说改编,讲述了数学天才林兆生与女儿林朝夕、高智商少年裴之,在数学推理和双时https://www.ikmeiju.cc/video/25156.html
3.天才只是见我们的门槛天才只是见我们的门槛我的偶像巨顽皮 天津 0 打开网易新闻 体验效果更佳这绝对是华语乐坛最大的遗憾,歌手好不容易唱火的歌,却无法再唱 超凡音乐 1551跟贴 打开APP 儿媳母亲身患重病,婆婆却狠心借不还钱,最终婆婆报应来了(上) 不二小动画v 3跟贴 打开APP 王牌飞行员的零式战机被F4U战斗机击落,阴沟里翻船 空https://m.163.com/v/video/VCIMB7531.html
4.《天才基本法1》高清全集免费在线观看经典国产剧2、《天才基本法》是什么时候上映/什么时候开播的? 网友:详细日期也可以去百度百科查询。 3、《天才基本法》如果播放卡顿怎么办? 百度贴吧网友:播放页面卡顿可以刷新网页或者更换播放源,更换播放源网址是:http://www.bizhimarket.cn/m-tiancaijibenfa.html 4、手机版免费在线点播《天才基本法》哪些网站还有资源? https://www.bizhimarket.cn/play-tiancaijibenfa-2-1.html
5.《天才基本法电视剧》免费在线观看全集天才基本法电视剧免费在线观看全集于2022在新视觉影院播放,可以用手机在线观看天才基本法电视剧天才基本法全集完整版。天才基本法主要剧情介绍了这出戏是按照同名小说改编的。故事讲述了年轻女孩林(章子枫饰)因持久敬慕父亲林(雷家印饰)和初爱恋人裴之(章心诚饰)这两http://www.jdcyl.com/xinshijue185256.html
6.6万粉丝1万作品期待你的评论军事视频免费在线观看简介:用户@48f6731d上传的军事视频:学天才发明彩票中奖算法,中头奖14次,有2国因他修改法律,粉丝数66681,作品数13667,评论数1,免费在线观看,视频简介:谈古今、论趣史、尽在闻史观天下! UP主简介 用户@48f6731d 粉丝数:66681 作品数:13667 泡泡活动 追溯历史古今,畅谈人闻趣事军事在线观看 追溯历史古今,畅谈人闻https://www.iqiyi.com/v_20z4r9hgv2g.html
7.《天才眼镜狗》动画片HD云播资源在线观看完整版1992 美国 剧情 《《天才眼镜狗》动画片HD云播资源在线观看完整版-光棍》剧情简介:晚点独家丨地平线重组智驾算法团队加大投入高阶魔是疯狂是不可理喻是偏执于自己的路白凝冰的魔性让方源看到了她身上可以利用的价值《天才眼镜狗》动画片HD云播资源在线观看完整版-光棍杀不得身旁的龙人蛊仙黄维立即叫喊起来http://www.cbst.com.cn/curs/2024111813748272.shtml
8.《我的天才女友第二季》电视剧在线观看全集海外剧天狼影视网为您提供2024最新海外剧『我的天才女友第二季』电视剧在线观看,我的天才女友第二季剧情为:一晃眼多年过去,爱莲娜(玛格丽塔·马祖可 Margherita Mazzucco 饰)和莉拉(盖娅·吉拉切 Gaia Girace 饰)都长大成人。莉拉嫁给了斯特凡诺(乔万尼·阿穆拉 Giovanni.http://www.zjg-ads.com/ProShow_47871.html
9.天才基本算法之芝士裴之归来免费阅读免费小说全文作者天才基本算法之芝士裴之归来是作者南瓜要觉醒在话本小说网连载的一部热门幻想小说。话本小说第一时间提供天才基本算法之芝士裴之归来最新章节在线阅读。https://www.ihuaben.com/book/8967501.html
10.天才的基本算法理想股票技术论坛天才基本算法涵盖基础知识、核心概念、实现技巧等内容,引领读者深入了解算法的核心思想,帮助初学者轻松入门。该算法不仅是计算机科学领域的基础,也是解决现实问题的关键工具。通过解析各种算法的原理和应用场景,让读者更好地理解并掌握算法的应用技巧。 ,理想股票技术论https://www.55188.com/tag-8836704.html
11.排序算法睡眠排序面条排序猴子排序(非常严肃)构造n个线程,它们和这n个数一一对应。初始化后,线程们开始睡眠,等到对应的数那么多个时间单位后各自醒来,然后输出它对应的数。这样最小的数对应的线程最早醒来,这个数最早被输出。等所有线程都醒来,排序就结束了。能脑洞大开想出此算法的,绝壁天才啊。。。 https://www.jianshu.com/p/4f526ea40df4
12.《性福演算法》电视剧完整版资源免费在线观看波兰电视剧《性福演算法》是一部有趣而发人深省的故事,围绕当今年轻女孩的生活展开叙述,讲述了她们在成长过程中了解到的女性力量和性知识。电视剧性福演算法由首播影院在互联网自动收集到网页端免费在线观看,后续将提供《性福演算法》百度云还有迅雷下载,请关注首播影院!收起 说明: 首播影院提供《性福演算法》在线播放地址,包含https://www.mhz8.com/voddetail/80739.html
13.个推漫话数据智能,解读《天才基本法》中的贝叶斯网络及原理最近的热播剧《天才基本法》中,提到了很多有趣的数学知识点,比如“亲和数”“巴什博奕”“孔明棋”“七桥问题”等等,让很多观众直呼不明觉厉。其中,最让Mr.Tech感兴趣的是剧中男女主参加数学建模大赛时用到的贝叶斯网络。 ▲女主使用贝叶斯网络进行算法建模,来预测嫌犯行动轨迹和抓捕时间方位。图片截图自电视剧《https://blog.csdn.net/Androilly/article/details/126388889
14.重庆三峡学院2018年硕士研究生心理学考试大纲攻读教育硕士专业学位入学考试心理学科目要求考生系统掌握该学科的基本知识、基础理论和基本方法,并能运用相关理论和方法分析、解决教育实践活动中的心理现象与实际问题。 二、考试形式与试卷结构 (一)试卷成绩及考试时间 本试卷满分为150分,考试时间为180分钟。 https://xue.baidu.com/okam/pages/strategy-tp/index?strategyId=136093032250286&source=natural
15.决胜21点电影高清完整版视频在线观看本有着惊人的才华,教授希望他加入自己的21算法团队,专门去赌场依靠算牌赢得大钱。本出师的成功使其尝到了甜头。可同时他却和旧友疏远,迷失在赌场的漩涡里。主演:Jim Sturgess, Kevin Spacey, Kate Bosworth导演:Robert Luketic添加片单 喜欢 不喜欢 类似影视 5.7 7.3 6.3 6.9 7.9 7.6 9.3 7.0 7.7 7.2 7.0 https://v.guoing.com/play/13624
16.个推漫话数据智能《天才基本法》中的贝叶斯网络及原理解读最近的热播剧《天才基本法》中,提到了很多有趣的数学知识点,比如“亲和数”“巴什博奕”“孔明棋”“七桥问题”等等,让很多观众直呼不明觉厉。其中,最让Mr.Tech感兴趣的是剧中男女主参加数学建模大赛时用到的贝叶斯网络。 ▲女主使用贝叶斯网络进行算法建模,来预测嫌犯行动轨迹和抓捕时间方位。图片截图自电视剧《https://cloud.tencent.com/developer/article/2074214
17.“天才少年”连发3篇Nature,出道即巅峰,学会这些新技术,您也+进阶实例演练的讲授思路,从初学及应用研究角度出发,带大家实战演练机器学习在单细胞多组学整合分析中的数据处理、预测模型以及生物学意义阐述等,助力大家掌握多种机器学习算法模型的构建以及在单细胞多组学联合分析在具体科学研究中的实际应用,并介绍当下深度学习算法高维组学数据处理,生物网络挖掘的前沿方法,有助于研究创https://blog.51cto.com/u_16077014/7082154
18.足球直播足球免费在线高清直播足球视频在线观看无插件(安全平台)官方入口是当下最热门的西游手游之一,也是梦幻西游端游的延续,现在手机上也可以体验到原汁原味的梦幻西游了,基本玩法和端游一样,只是部分设定更加事实上的确存在一些算法,学员必须具备优秀的数学基础和编程能力才能驾驭。 【二十一】创建之单例设计模式单例模式是Java中最简单的设计模式之一。这种类型的http://m.zxtwmzb.com/down/343675.html
19.正义的算法第16集剧情第16集:正义的算法16集剧情:天才也有自己的烦恼 林小颜最近一直跟着小朋友,拍摄他的一举一动,其实小朋友每天的生活还是很单一,除了排练也没有其他的爱好。1.请问哪个平台可以在线免费观看国产剧《爱就在你身边》? 优酷视频网友:《爱就在你身边》免费在线观看地址:http://www.nmhengli.com/zongyi/aijiuzainihttp://www.nmhengli.com/juqing/zhengyidesuanfa/142859.html
20.#天才基本法今日开播#由@雷佳音@张子枫@来自微博电视剧#天才基本法今日开播# 由@雷佳音 @张子枫 @张新成 主演的《天才基本法》今天19:30就要开播啦!#天才基本法人生几何版海报# 满满的公式看起来好高深!数学可以用公式解答,但人生没有算法!希望两个时空的老林、林https://weibo.com/5406006781/LDqpQDoeo
21.电影《天才少女》里的德氏计算法是什么?电影《天才少女》是 2017 年一部冷门佳作,影片讲述的是一个 7 岁天才女孩玛丽和她的舅舅弗兰克之间的故事。 不过本文不讨论电影相关的问题,而是打算从以下几方面介绍一下玛丽在里面用到一个算法 - 德氏计算法。 基本定义 准确来说,这个算法的正确名字应该是 The Trachtenberg Speed System(特拉彻伯格速算法,下文为https://zhuanlan.zhihu.com/p/633940891
22.正义的算法第16集电视剧全集高清独家在线观看bilibili用手机观看 一起看 正义的算法 2.4亿播放· 40.4万弹幕· 69.4万追剧 搞笑/ 剧情· 2022· 已完结, 全26集· BV1xW4y1k7HM 出演演员:陈柏霖郭雪芙林格宇侯彦西阿喜·林育品陈雪甄威廉唐振刚邹承恩洪晖森黄品瑜 简介:实力超群、帅痞魅力的律界明星刘浪(陈柏霖 饰)在即将高升之际,人小鬼大的可爱萌娃刘良良(林格https://www.bilibili.com/bangumi/play/ep519393/