一文说清AI智能平台云平台算法ai生命周期

编辑导语:如今平台产品已不是新概念,随着AI技术的成熟,AI平台产品也越来越多。那么,为什么要做AI平台?这些AI平台又有哪些类别呢?让我们跟着作者,一起去探寻吧。

有一天,小李的领导说:“我们要做AI平台!”。

虽然平台产品也不是新概念了,随着AI技术的成熟,AI平台产品也越来越多,但光凭做平台一句话,小李还是犯了难——大大小小的“平台”很多,究竟我们要做什么样的AI平台呢?磨刀不误砍柴功,小李决定先研究下市面上已有的AI平台找找灵感。

一、AI平台产品分类

AI平台大致可以分为AI开发平台和AI支撑平台(名字是小李瞎起的)两类。

1.AI开发平台

AI开发平台面向的是模型开发者,围绕AI模型/算法的生命周期(数据收集、标注、模型结构设计、模型训练、模型部署等阶段)提供工具。开发平台产品需要对算法开发流程、算法种类丰富度都有较好的积累,因此大部分平台类产品是由内功比较深厚的大厂推出的。

(百度BML功能架构)

1)用户

都叫开发平台啦,用户想必应该是开发人员,使用AI开发平台的研发人员对人工智能的了解程度不尽相同,他们可能是业务应用的开发人员(只需要调用某个模型API),也可能是AI工程师(需要对模型调参数,甚至重新设计网络结构),但归根到底AI开发平台是面向开发人员的B端产品。

2)场景

在需要AI能力支撑的时候,用户可以使用AI开发平台提供的不同层级的工具/功能(嵌入级、API级、数据训练级、模型定制级、算法开发级),实现所需的AI能力。

3)解决问题

AI赋能其他产品。AI平台作为一个产品,想解决的核心问题是如何便捷的让其他应用或产品获得智能化的能力。看到很多强调AI平台是为了让AI算法开发更简单的说法,但归根到底,如果不是其他产品需要AI模型或者AI能力,自然也不需要算法开发,更就没有必要有所谓AI开发平台存在了。

2.AI支撑平台

AI支撑平台大多是面向运营人员/业务人员,为某个AI应用提供能够使之work的配置、管理等“支撑”功能。智能对话平台就是一种非常典型的AI支撑平台,因为智能对话应用并非只依赖某个模型就能实现,所以需要根据业务场景进行技能管理、对话设置等工作,智能对话平台就是这些配置功能的载体。

主要是业务人员或者运营人员,也就是需要对某个应用的具体规则、具体内容进行设置的工作人员。

在使用某个智能应用时,用户需要根据实际业务场景对应用中的某些功能进行配置,才能使应用按照需求运行起来。

使智能应用按照用户的期望运行起来。那为什么这些应用需要配置呢?为什么不能固化呢?因为应用的使用场景千差万别,比如在银行的智能客服和商场的智能客服,虽然底层的技术途径一致,但具体客服面对的问题、使用的话术完全不一样。

从产品角度看,为了使产品的通用性更强,我们往往会设计一个通用的应用框架,然后把高频且重要的功能做成可配置项以适应更多用户的需求。也不是说把功能固化下来不行,但那样的话产品就变成了定制化的项目,成本非常高且无法复用。

(AI开发&支撑平台对比)

二、AI开发平台1.按AI模型生命周期拆解

知乎看到的一个比较好的平台产品定义:“平台产品提供共用性强的工具,连接多端多角色之间的活动或交易”。AI开发平台产品也一样,是围绕着围绕AI模型/算法的生命周期提供工具,连接不同层次开发者对AI模型设计、训练、使用等活动。

AI模型的生命周期,大概是这样的:

AI开发平台即然是服务于AI模型生命周期的工具,自然也离不开以上这些模块。所谓平台,可以只针对某一个环节,比如数据收集+标注环节,或者模型部署环节,也可以针对整个生命周期,这就解释了为什么同是AI平台,有大有小。

如果我们从AI模型生命周期角度拆分,那么就有:

1)数据标注平台

面向数据接入、清洗、标注等和训练数据有关的工作。数据接入、清洗的工作其实和大数据的关联性比较强,有些标注平台甚至是大数据系统的组件。

对于AI标注/数据平台来说,一个思路是类似百度的EasyData,针对模型训练数据提供一部分预处理功能(如缩放、翻转图像提高模型鲁棒性,或者对图像进行滤波、降噪等增强操作)和智能标注功能(先利用已经训练好的模型自动标注一把,然后再由人工校准或微调),正是这些功能支撑起了数据标注平台。

另外一个不错的思路是更侧重“标注”这个动作本身,类似basicFinder,做数据需求方和数据标注商的撮合生意并提供标注工具。

2)模型设计平台

这个一般不会作为单独的产品,个人猜测原因主要是模型结构设计门槛高、需求小。从我自己的经验来看,使用开源框架开发和使用平台提供的工具效率差别不大。

模型设计的功能大多是作为开发平台一个模块,通过可视化拖拉拽、notebook等方式进行模型结构设计。

3)模型训练平台

提供模型训练的算力、环境,这个是AI平台中比较常见的产品,由于模型训练对硬件资源的高消耗,通常会租用云计算资源来完成模型训练,所以很多模型训练平台是与云平台捆绑的,完成包括负载均衡、并行训练等工作。

4)模型部署平台

提供把模型从训练环境部署到推理环境(云端、边缘端等)的工具。这个功能相对简单,较少单独作为一个产品,一般是也是作为开发平台的一个功能模块。

一个例外是边缘/嵌入式环境部署平台(如百度EasyEdge),由于硬件适配比较繁琐,所以目前看到百度是做成一个相对独立的产品的。

5)模型推理平台

提供各式各样的模型接口,供用户直接调用,一般还提供包括模型调用管理、接口管理等功能,这种推理平台主要是以模型作为核心竞争力的。另一种推理平台则以算力作为竞争力,类似云平台,用户将模型部署在平台上可获得弹性扩缩容等能力。

2.按业务需求拆解

把5级业务需求和生命周期对比来看,业务的按需分层和模型生命周期的各个阶段基本是呈对应关系的。需求越高级,追溯到的生命周期越靠前。

功能嵌入和API调用级需求只涉及模型推理,数据训练级需求涉及数据标注、训练、部署以及推理过程,模型定制和算法开发级需求就涉及全流程的功能了。

3.一些典型产品

上图给出了一些AI开发平台产品的AI模型生命周期覆盖情况,可以看到大部分产品其实都是提供全生命周期的功能的。当然不是说以上的分析没有意义,按生命周期或者按需求层次拆解还是可以帮助我们捋清产品架构的。

个人觉得其中百度的功能架构是最舒服、逻辑性最好的。百度的AI开发平台包括BML和EasyDL两个,BML是全流程的开发平台,覆盖了AI模型全生命周期;EasyDL定位是零门槛开发,所以只支持到数据训练级别的开发。

腾讯TI系列平台中,TI-ONE定位是“一站式机器学习服务平台”,但暂时没有看到关于数据标注方面的功能,数据处理只提供相对简单的数据接入和数据预处理功能。预置模型相对来说也比较少,大部分是机器学习方面的模型,深度学习模型较少。

TI系列的其他两个平台TI-Matrix和Ti-EMS分别是“AI应用服务平台”和“无服务推理平台”,个人感觉都更偏向云服务一些,主要是服务调度、扩缩容等能力。

华为ModelArts也提供从数据标注到模型推理全流程的开发工具,其中“自动学习”的功能模块基本对标百度EasyDL,提供重训练级别的模型生成,但暂时没有按照需求层级进行产品拆分。

三、AI支撑平台

AI支撑平台比起AI开发平台,更类似业务平台,比如内容审核、智能对话等。围绕的是一个核心算法,通过配置提升这个算法/能力的通用性。

下图举个内容审核平台作为栗子~横向是发布图片的业务流程,纵向是审核平台的功能,可见审核平台是和业务紧密结合的。

审核平台的核心其实就是分类问题(把输入的图片分为合规、不合规),外部输入是图片,输出是图片是否合规、违规类型、准确率等信息,而审核策略的制定、验证则是为了支撑图像分类算法在内容审核这个场景下work,说到底“支撑”就是配置、设置。

四、一点思考1.为什么需要AI平台?

从AI平台公司的角度看:AI平台提供的是一套标准化的工具/流程,80%的需求可以由标准化的产品来满足,而非每个需求都单独定制解决方案。通过AI平台这样的标准化产品来提升ROI,从而实现盈利。

不论是从用户角度,还是从提供AI平台的公司角度,其实AI平台的存在都是为了提升投入产出比。

但个人感觉,目前AI平台公司对AI平台的需求是要大于用户的,这就造成了产品多用户少的囧境。用户对AI平台的不认可,一方面可能是对AI能力带来的收益的不确定;另一方面可能是对AI平台提高ROI的不确定(有可能使用了AI平台但还是无法节约人力投入)。所以如何让用户发现AI能力的价值,进而发现AI平台的价值还是个值得思考的问题。

2.如何做到AI平台的差异化?

市面上那么多AI平台,如何做到让用户选择你的产品呢?差异化。

怎么做到差异化呢?不同用户对AI能力或应用的需求侧重各不相同,但是无外乎数据、算力、模型三要素。

1)数据入手的差异化

当前很多行业还是存在缺乏数据积累的事实的,所以数据对于这部分公司来说就是最大的痛点。从数据角度入手的AI平台,最直接的是可以主打提供行业数据。如果数据不可获取,可以退一步和大数据平台结合提供数据采集、清洗、标注(自动、人工)等功能,解决用户数据方面的痛点。

前边提到的basicFinder,就是由标注平台逐步发展出来的AI平台。

2)算力入手的差异化

不论是训练阶段还是推理阶段,AI模型对算力都是强依赖的,因此从算力入手的AI平台也是发展最早的一种,一般都和云平台紧密结合,最后的收益落脚点都是云资源。

随着AI芯片发展,以嵌入式设备为载体的边端智能也越来越多,所以算力入手也可以指嵌入式算力。华为算是以算力为核心的代表公司。

3)模型入手的差异化

3.如果要做AI平台,怎么入手?

个人感觉现在做AI平台是件很难的事情了,本身这类产品就已经有点供大于求了,做差异化也需要结合已有的积累(无论是数据、算力还是模型),所以从头做一个成功的AI平台真的非常困难,留给AI平台的机会可能只有+行业了。

大胆开麦:短期之内做AI支撑平台的难度远小于AI开发平台,而成功率应该是要高于AI开发平台的。与其做一个大而全却没有明确目标用户的AI开发平台,不如围绕一个点做一个真正有人用的AI支撑平台。

THE END
1.人工智能训练平台数据集管理和自定义算法管理的一站式人工智能训练平台。 立即体验 统一的人工智能运行环境 兼容以TensorFlow、PyTorch、Caffe为主的人工智能计算框架,支持多种计算运行库, 提供容器化与虚拟化计算资源,利用分布式计算优势,提高模型训练效率。 立即体验 工业智能平台,开放智慧企业ET大脑服务能力 https://ei.casicloud.com/
2.国内加载流畅的AI模型训练平台Swanlab快速入门SwanLab是一款开源、轻量级的AI实验跟踪工具,提供了一个跟踪、比较、和协作实验的平台,旨在加速AI研发团队100倍的研发效率。 其提供了友好的API和漂亮的界面,结合了超参数跟踪、指标记录、在线协作、实验链接分享、实时消息通知等功能,让您可以快速跟踪ML实验、可视化过程、分享给同伴。 https://blog.csdn.net/2401_85578645/article/details/139744954
3.TIONE训练平台AI模型训练AI开发平台TI-ONE 训练平台(TI-ONE)是为 AI 工程师打造的一站式机器学习平台,为用户提供从数据接入、模型训练、模型管理到模型服务的全流程开发支持。TI-ONE 支持多种训练方式和算法框架,满足不同 AI 应用场景的需求。https://cloud.tencent.com/product/tio
4.TIONE训练平台AI模型训练AI开发平台TI-ONE 训练平台(TI-ONE)是为 AI 工程师打造的一站式机器学习平台,为用户提供从数据接入、模型训练、模型管理到模型服务的全流程开发支持。TI-ONE 支持多种训练方式和算法框架,满足不同 AI 应用场景的需求。https://cloud.tencent.cn/product/tione
5.模型训练平台模型训练平台是基于多种机器学习框架开发的人工智能云平台,具有强大的硬件资源管理能力以及高效的模型开发能力,可进行模型开发、分布式训练与服务发布,降低AI使用门槛,提升开发效率,助力车企加速智能化转型。https://www.z-one.tech/products/modeltraining/
6.深度学习训练平台–中科特瑞产品 一站式大数据分析平台 大数据治理平台 数据标注平台 人脸核身系统 深度学习训练平台 AI一站式开发平台 i9000大数据生态系统 iCloud云计算平台 供应链金融开发平台 瑞翼链BAAS开发平台 瑞翼ETH开发平台 瑞数安算隐私计算平台 DC-Web工业互联网平台http://teruitech.com/deeplearning-platform/
7.国内的大模型训练平台星环科技为您提供国内的大模型训练平台相关内容,帮助您快速了解国内的大模型训练平台。如果想了解更多国内的大模型训练平台资讯,请访问星环科技官网(www.transwarp.cn)查看更多丰富国内的大模型训练平台内容。https://www.transwarp.cn/keyword-detail/34604-1
8.开练app下载开练(健身训练服务平台)v5.1.4安卓版下载开练是健身训练服务平台,支持动作讲解、运动记录、数据统计、趋势复牌等功能,提供大量健身视频,专业指导,软件会根据你的时间安排自动生成专属训练计划,让你科学健身不走弯路,还能通过智能分析你的历史训练数据,并根据你的训练时间、身体部位、肢体动作等多个维度提供可视化图表,为你展示每一块肌肉的训练效果,助你快速复盘https://www.jb51.net/softs/910245.html
9.大模型训练平台大模型训练(及服务)平台集成了数据管理、模型管理、CI/CD流程编排、GPU/NPU资源调度、自动伸缩等能力和相关最佳实践,为大模型的训练和 服务提供了全面支持。该平台通过自动化和智能化的管理手段,显著提升了模型训练的效率和质量,并降低了服务成本。https://www.huaweisoft.com/dmxxlpt
10.FiF智慧教学平台聚合教育生态应用,打造智慧教学平台 讯飞AI课堂 围绕课前、课中、课后教学闭环,基于 动态数据分析,打造全新的智慧教学环境 FiF口语训练系统 语音技术,科学评测,即时反馈 训练题库,内容丰富,题型多样 > FiF在线课程 多个平台,个性课程;学习进度,一目了然 https://www.fifedu.com/
11.海康威视AI开放平台有哪些能力?海康威视AI开放平台是承载了算法模型训练、设备开源开放和生态应用开放共享等能力的平台,为广大用户提供了一站式训练平台、设备开放平台和算法应用编排平台。下面来看看这些平台能提供哪些能力吧! 1、一站式训练平台 一站式训练平台是海康威视AI开放平台面向智能感知领域打造的一站式AI算法模型开发平台,提供数据管理、数据http://www.huiyikj.com/articles/hkwsai1047.html
12.慕言橙长Growth线上训练工作室平台慕言科技 —— 致力于中国儿童成长发育历程及特殊教育领域,专注于早期筛查、辅助训练、康复治疗的在线平台服务https://www.aimysw.com/index.php?tag=faq
13.悟道大模型训练平台火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和应用工具开放给外部企业,提供云基础、视频与内容分发、数智平台VeDI、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。本页核心内容:悟道大模型训练平台https://www.volcengine.com/theme/3146327-W-7-1
14.海康威视AI开放平台海康威视AI开放平台是面向行业用户与生态合作伙伴打造的一站式AI模型开发和应用平台。提供数据集管理、数据标注、模型训练、模型管理、应用集成的全流程AI服务,致力于打造AI视觉应用生态。https://ai.hikvision.com/
15.口语100学生版免费下载口语100,面向中小学生的英语口语教育平台。 特色卖点 给每个学生一个口语陪练,配套各类中小学教材,在音节层次上纠正口语发音。 厂商联系方式 官方网站:http://www.kouyu100.com/ 联系电话:400-016-0066 邮件:cs@kouyu100.com 口语100 app介绍 口语100 app,一般又称英语100口语app,口语一百学生app,口语100手机版。https://www.liqucn.com/app-rn-489612-17
16.GPU如何实现高性能大模型的百倍训练加速蓝海大脑大模型训练平台是蓝海大脑自主研发的高性能计算平台,专用于大模型训练和推理。该平台采用先进的硬件架构和优化的软件算法,可以提供高效的计算能力和存储能力。 大模型内部运行原理 近年来,在大规模语料上预训练 Transformer 模型产生了预训练语言模型(Pre-trained Language Model, PLM),在各类自然语言处理任务上展https://blog.51cto.com/u_15497017/7418809
17.立起新时代军事训练的“魂”和“纲”——陕西庶区推动新大纲在此基础上,省军区依托训练基地,根据年度训练任务和重点训练项目,将全年各级各类人员训练全部安排在基地,省军区统一制订训练计划,分期分批施训,实现了统建训练平台、统配教管力量、统一基地施训、统筹训练保障。 此外,省军区还广泛开展群众性练兵比武活动,提高军事训练实战化水平,按照分层次组织、分专业设置、分科目参加https://sn.cri.cn/chinanews/20180821/a52ae04e-5833-6e14-1a7b-c8489c4520d5.html
18.智慧军营之智慧训练场平台北京西岐智慧军营解决方案集成智慧军校、智能营区、智慧营院、智慧训练、智慧边防、智慧政工、请销假系统、人员管理系统、车辆管理系统、车辆派遣系统、机关办公系统、政治教育系统、访客登记系统、装备保障系统、战备值班系统、后勤保障系统、智慧考试系统、辅助决策系统、三维可视大屏、综合态势平台等软硬件结合一体化解决方http://www.zhihuijunying.cn/info?id=9
19.大模型训练效率是推动大模型进化关键此前,智谱AI训练平台的存储方案以混闪为主,尝试通过堆叠存储节点满足空间容量和高并发带宽访问需求,但这种方式造成存储空间严重浪费和存储成本的急剧增长,在数据体量持续增长的情况下不可持续。因此,智谱AI希望采购新的存储方案,同时满足高性能存储和成本可控。智谱AI经过多方调研,在综合考量技术先进性、性能指标、成功https://blog.itpub.net/29568843/viewspace-2995355/
20.AI体能申报考核系统标签:消防AI智慧训练系统,智能化训练平台,智慧考核,AI智慧体能申报考核系统 AI智慧体能申报考核系统(消防AI智慧训练系统)适用于消防救援队伍体能训练、自主申报、智慧考核、电子评分、自动上传和数据分析的业务应用。该系统基于物联感知及AI识别技术实现数字化训练数据采集,规范“数字化”训考机制,革新体能训考模式,实现指https://www.ff-iot.com/AIzhihuixunlian/576.html
21.货拉拉一站式云原生AI平台建设实践数据工程模型训练在线服务数据工程、模型训练、在线服务是机器学习技术实现的三驾马车,这个流程中处理的数据量大,计算量大、训练框架和版本多样、底层依赖复杂,资源算力管理,需要人工介入解决很多问题,给AI落地带来了比较困难。针对这一系列的问题,货拉拉大数据智能平台组从2020年开始就在探索提供一套完整的云原生的一站式AI解决方案,并从那时起https://juejin.cn/post/7213636024101765181
22.首页国内最活跃的CTF在线训练平台,网络安全爱好者首选。提供丰富的CTF、AWD、渗透加固题目,助力信息安全人才实战演练和技能提升。https://ctf.bugku.com/