针对用户需求,不断优化算法,人工智能工程技术人员为机器注入智慧力量

日前,人社部等部门向社会发布“区块链工程技术人员”“互联网营销师”等9个新职业,这是我国自《中华人民共和国职业分类大典(2015年版)》颁布以来发布的第三批新职业。

——编者

一台轻薄的笔记本电脑,一部高清的大屏幕显示器,一叠码放整齐的纸张,再加一支随意放着的笔……上午8点,伍大勇早早来到办公室,简洁而工整的案头跃入眼帘。

设计模型,和机器对话

“老板拖欠工人工资不讲诚信,我能要求赔偿吗?”

“根据劳动争议调解仲裁法规定,用人单位违反国家规定,拖欠或者未足额支付劳动报酬,劳动者可以向劳动行政部门投诉,劳动行政部门应当依法处理。”

用户在手机上简单一键式操作,背后是人工智能工程师的复杂工序。接到任务后,伍大勇抽出几张纸放在面前,开始构思模型,奋笔疾书。

一个多小时后,白纸上已被勾画得满满当当。“要让机器听话,首先要能和机器对话,这就要把问答任务转化为机器能处理的算法。”

在伍大勇的图纸上,任务已被清晰地分成三类算法:文本表示算法,为了把问题变成机器能看懂的语言;分类算法,用来解决哪个领域的法律能够适用用户提出的问题;文本匹配算法,用来解决具体法条的对应问题。

上午10点多,伍大勇整理了一下稍显凌乱的案头,看了一眼梳理好的思路,长舒一口气:“‘地基’算是打好了,如果不能很好地转化为机器算法,后续搭起来的程序就难以实现需要的功能。”

短暂起身站了一会儿,伍大勇继续伏坐案边。基本思路敲定,他打开公司网上工作平台,联系数据资源部的同事拿到准备好的数据。“模型设计好后,要在网上大量搜集网友们的各种真实法律问题,并将已有回答中对应的法律法条逐条标注出来,‘投喂’给机器,让它根据算法学习解读一问一答中包含的对应关系。下午将是一场‘重头戏’。”

优化算法,提高精准度

“这一步是关键。”伍大勇坐下后,一边紧张地飞速敲代码,一边告诉记者,“别看这个功能用起来简便,得敲几百行,今天下午怕是弄不完。”

在“吧嗒吧嗒”的敲击键盘声中,3个多小时飞逝而过。伍大勇抬手一看,将近下午5点,转头看电脑屏幕,任务完成了一半多。他指着程序里密密麻麻的字符串介绍,“开头一段代码在定义问答中涉及的各种问题变量,接下来是调用各种算法,让机器一步步学习问答之间的逻辑关系。”

“今天完成的部分还不是人工智能工程师的全部,我个人的工作也只是人工智能浩繁领域中的一小部分。”伍大勇说,写完模型构建的代码后,要导入之前准备好的数据,在机房里大规模服务器上进行模型训练。其间,往往是漫长的等待,有时候训练过程要好几天。

模型的精准度越高,越能体现这一职业的技术含量。说到这里,伍大勇不觉语速加快,“机器精准度不可能达到百分之百,我要做的就是每天不停优化算法,让机器更通人性,有时提升一个点,要耗费好几个月,但也足够兴奋好几天!”

学习新知,练就“最强大脑”

当好一名人工智能工程师不容易。对机器的训练既检验着计算机等基础设施的算力,更考验着工程师自身的脑力。

“要想让人工智能程序回答得更精准,必须大量学习和积累新的算法模型,从而更好地训练人工智能。”伍大勇认为,这一行最突出的特点就是更新迭代非常快,五六年前的一些方法在今天看来已经有些过时,这就要求从业者不停学习、不断更新知识体系。

从大学毕业进入中国科学院计算技术研究所从事自然语言处理研究工作,到3年前转入科大讯飞北京研究院做人工智能工程师,在行业的浸染中,伍大勇如今已是人工智能领域的行家里手。

“成为一名人工智能工程师需要具备数学计算能力、对人工智能技术的理解能力以及系统科学和软件工程专业背景知识。”除此之外,伍大勇每天都要抽出2—3个小时学习和吸收新知识,让自己处在不断充实的过程中。

晚上6点左右,格子间工位上的员工纷纷散去,伍大勇合上电脑,查看手机上明天的日程安排:早上9点,部门有一场电视在线会议,继续讨论小程序在法律法条检索与自动推荐方面可能的优化方向。他说,疫情防控期间,远程办公、视频会议成为主要工作方式,更多远程在线庭审系统的运用,也促使人工智能工程师不断调整研究工作。

不远处,在办公室的玻璃墙上,下一款新产品的设计流程图清晰可见:从研究、开发到测试、部署,形成一条以人工智能工程师为主导的生产线。

“在科幻电影里,人工智能可以与人类展开自由交流,那是人工智能的未来,也是我们努力的方向。”伍大勇说,虽然那样的场景还很遥远,但在人工智能这个新兴产业中,有越来越多的人才加入其中。在一个个具体任务中,在一次次优化训练中,未来值得期待。(记者韩鑫)

(原标题:针对用户需求,不断优化算法,人工智能工程技术人员——为机器注入智慧力量)

THE END
1.机器学习(17)——GMM算法算法流程腾讯云开发者社区算法流程如下: GMM(Gaussian Mixture Model, 高斯混合模型)是指该算法油多个高斯模型线 性叠加混合而成。每个高斯模型称之为component。GMM算法描述的是数据的 本身存在的一种分布。 GMM算法常用于聚类应用中,component的个数就可以认为是类别的数量。 假定GMM由k个Gaussian分布线性叠加而成,那么概率密度函数如下图所示https://cloud.tencent.com/developer/article/1111765
2.机器学习的基本流程和十大算法总结 今天我列了下学习机器学习你要掌握的知识清单,只有你对机器学习的流程、算法、原理有更深的理解,你才能在实际工作中更好地运用,祝你在机器学习的路上越走越远。 编辑:峰会https://m.elecfans.com/article/2283826.html
3.深度学习算法的通用流程深度学习算法的通用流程通常包括以下几个步骤: 1.数据收集:收集与问题相关的大量数据。这些数据可以来自各种来源,如传感器、数据库、互联网等。数据的质量和数量对深度学习模型的性能有很大影响。 2.数据预处理:对收集到的数据进行清洗、预处理和标注。这包括去除噪声、处理缺失值、进行数据归一化或标准化等操作。标注https://wenku.baidu.com/view/c701ed3768ec0975f46527d3240c844769eaa0b7.html
4.科学网—[转载]联邦学习算法综述在一次联邦学习的合作建模过程中,数据持有方对本地数据的训练仅发生在本地,以保护数据隐私,迭代产生的梯度在脱敏后被作为交互信息,代替本地数据上传给第三方受信任的服务器,等待服务器返回聚合后的参数,对模型进行更新。图2展示了客户端-服务器架构的联邦学习流程。https://blog.sciencenet.cn/blog-3472670-1280769.html
5.九种深度学习算法简介从算法处理的流程来划分,基于深度学习的目标检测算法可分为两阶段(Two-Stage)算法和一阶段(One-Stage)算法,两阶段算法需要先进行候选框的筛选,然后判断候选框是否框中了待检测目标 。 一. 两阶段算法 两阶段算法包含选择候选框和修正目标分类/位置两个阶段,对这两个阶段的不同处理方式,构成了不同的算法方案。 https://www.51cto.com/article/703517.html
6.基于子带包络和卷积神经网络的心音分类算法本文研究心音自动分类算法框架如图1所示,具体步骤如下: 图1 心音自动分类算法流程图 Figure1. Flow chart of automatic classification of heart sounds 图选项 下载全尺寸图像 下载幻灯片 (1)对PCG信号进行标注,将完成标注的数据分为训练集、验证集、测试集。 (2)对标注信号进行预处理,把一段完整的PCG信号分https://www.biomedeng.cn/article/10.7507/1001-5515.202012024
7.全面人工智能技术栈与学习路线:机器学习深度学习视觉NLP机器学习:这门课程中学习:线性回归 与 决策树与支持向量机Adaboost以及Bagging算法。 深度学习:这门课程:人工神经网络 单层/多层感知机 BP神经网络 Hopfield网络 卷积神经网络 LeNet5 这本书:《人工智能原理及其应用》特别全面,还有很多知识上述没列出来,下面将详细介绍。 https://download.csdn.net/blog/column/9899622/108107911
8.重建生态:价值与系统的力量——第七届中国教育创新年会11月启幕以教育人今天的认知与行动更新,告诉校园里必将走过的每一个孩子:任何发生在我们身边的事情,都是对自己成长和学习的邀请。 第七届中国教育创新年会组委会 滑动查看流程 ▼ 学术主持:邱华国(苏州半书房发起人) 如何准确理解学校办学目标,制定有效的教研标准? 刘充(宁波蓝青小学副校长) 一场高品质的教研,要https://sghexport.shobserver.com/html/toutiao/2020/08/26/250533.html
9.算法的学习基础根据《算法导论第三版》中的描述:算法就是任何问题的解决过程,它接收一些值或集合,对这些值或集合进行加工,最后产生一些值或集合作为输出,算法指的就是将输入转换为输出这个过程中的一系列计算流程。 简而言之,我们可以说算法就是解决一个特定任务的一系列步骤。 https://www.jianshu.com/p/225ff014a7d5
10.机器学习算法的整体流程(非常易懂)TheChosenOne(3)输入基础训练数据集利用scaler对其进行数据归一化处理 (4)对于归一化的数据集进行机器学习算法的训练fit过程; (5)输入测试数据集对其结果进行预测predict; (6)将预测结果与真实结果进行对比,输出其算法的准确率score(或者混淆矩阵) 2、机器学习的具体流程图如下:https://www.cnblogs.com/Yanjy-OnlyOne/p/11295980.html
11.算法入门:从零开始学习算法的简单教程本文介绍了算法入门的基础知识,包括算法的基本概念、重要性及其应用领域。文章详细解释了如何描述和分析算法,并列举了常见的算法类型及其应用场景,适合希望从零开始学习算法的读者。 算法入门:从零开始学习算法的简单教程 算法基础概念介绍 什么是算法 算法是一组定义明确的指令,用于解决特定问题或完成特定任务。算法可https://www.imooc.com/article/357937
12.深入浅出深度学习算法之BP神经网络详细公式推导学习率η∈(0,1)控制着沿反梯度方向下降的步长,若步长太大则下降太快容易产生震荡,若步长太小则收敛速度太慢,一般地常把η设置为0.1,有时更新权重时会将输出层与隐含层设置为不同的学习率。BP算法的基本流程如下所示: BP算法的更新规则是基于每个样本的预测值与真实类标的均方误差来进行权值调节,即BP算法每次https://www.cda.cn/view/126505.html