百度智能云致力于为企业和开发者提供全球领先的人工智能、大数据和云计算服务,加速产业智能化转型升级。
百度智能云大模型平台根据不同企业及开发者需求,提供公有云服务、私有化部署两大服务模式。在公有云服务方面,百度智能云大模型平台将提供:推理(直接调用大模型的推理能力)、微调(通过高质量精标业务数据,高效训练出特定行业的大模型)、托管(将模型发布在百度智能云,以实现更加稳定高效的运行)三种服务,大幅降低企业部署大模型的门槛。根据美国国际研究中心的2022年上半年中国公有云市场报告,百度连续第四年再次名列AI云服务第一名。
AI公有云与软件市场,主要包含三大板块:AI公有云是现金流业务,AI算法和软件定制是面向现实的业务,AI算力和大模型是面向未来的业务。百度智能云在这三大领域均有大规模布局。
◎飞桨
飞桨(PaddlePaddle)是集深度学习核心框架、工具组件和服务平台为一体的技术先进、功能完备的开源深度学习平台,已被国内企业广泛使用,深度契合企业应用需求,拥有活跃的开发者社区生态。提供丰富的官方支持模型集合,并推出全类型的高性能部署和集成方案供开发者使用。
飞桨作为百度产业级深度学习框架,是直接支撑文心大模型的平台,也是目前被广泛使用的深度学习框架。截至2022年底,飞桨开发者社区已增长到535万人次,并已服务超过20万家企业,位列中国深度学习平台市场综合份额第一。到2022年底,开发者已于飞桨上创建了67万个模型。
百度飞桨平台具备开发便捷、动静结合部署等多重优势,未来有望吸引更多开发者及企事业单位及科研院所加入,共同推动国内AI大模型的研发和应用。飞桨平台在框架易用性、训练技术、推理引擎和模型库四大方面均具备显著优势,可供开发者快速便捷地进行AI开发。
在百度AI能力的整体架构中,深度学习框架位于第二层,整体的四层能力包括「底层芯片+深度学习框架+大模型+应用层」。
◎AI芯片-昆仑芯
昆仑芯科技已成功推出两代通用AI计算处理器产品:昆仑芯1代AI芯片、昆仑芯2代AI芯片,及多款基于自研芯片的AI加速卡:K100、K200、R200系列,以及AI加速器组R480-X8。新一代AI芯片、AI加速卡及更多产品正在研发中。
昆仑芯1代AI芯片基于昆仑芯自研架构XPU设计,针对云端推理场景,支持通用AI算法,在百度搜索引擎、小度等业务中部署,涉及互联网、工业制造、智慧金融、智慧交通等领域。
昆仑芯2代AI芯片基于自研架构昆仑芯XPU-R而设计。相比1代产品,2代AI芯片主要为数据中心高性能计算提供算力,支持自然语言处理、计算机视觉、语音以及传统机器学习等各类人工智能任务。
◎文心一言-文心大模型
受益于百度知识图谱文心大模型成为了全球首个知识增强千亿大模型。文心大模型已历经多次迭代,在更早之前也已经从单一的自然语言理解延伸到多模态,包括视觉、文档、文图、语音等多模态多功能。
百度为推进大模型深入产业落地,与行业头部企业联合研发融合行业数据、知识以及专家经验的行业大模型,目前百度文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型。
文心大模型全景图刷新,构建产业大模型体系。大模型的出现,为人工智能进一步发展带来新机遇,深度学习平台加大模型,贯通AI全产业链,夯实产业智能化基座,将进一步加速智能化升级。
文心一言通过自然语言交互的形式,根据用户的指令,完成问答、文本创作、代码查错等任务。其能力和应用场景非常广泛,主要包括以下几个方面:
1.2移动生态
根据开放式平台模型,百度总计利用百家号账户,智能小程序及托管页的网络合作伙伴,持续发展其庞大的第三方内容及服务。百度于AI及强大知识图谱开发方面积累的数十年经验使其能够在开放平台上将用户意图与长尾,第三方内容及服务进行匹配。
移动生态中包括数十个应用程序,其中包括百度App、好看视频及百度贴吧,为公众提供通过搜索及信息流发现及消费信息并与内容创作者,发布者,服务提供商及商户交流与互动的平台。从用户获取到用户关系管理再到闭环交易的类似于本地应用程序的体验,向商家展示百度的价值,令他们能够在平台上进行用户生命周期管理,亦使百度总计成为搜索及信息流的领先在线营销服务供应商。
在移动生态业务中,百度为50万名客户提供服务,使其能够利用庞大的用户群。百度主要通过提供全面有效的营销服务来满足客户需求,并从中变现。这部分收入主要来自提供搜索,信息流及其他营销服务,占2020年,2021年及2022年总收入的大部分。
1.3智能驾驶
百度智能驾驶与其他增长计划包括有发展前景及巨大市场机遇的业务,部分业务处于商业化初期,客户群不断增长。百度作为智能驾驶及智能设备领域的市场领导者,正凭借其独特的AI能力,数据洞察力及内部研发芯片寻求快速增长机会。
萝卜快跑提供共享无人车服务,萝卜快跑在国内大陆向十个以上城市的公众开放。2022年,萝卜快跑供应的无人驾驶出行服务订单超过1.5百万单。到2023年1月底,萝卜快跑累计向大众提供的无人驾驶出行服务订单超过2百万单。自2021年11月25日起,萝卜快跑已开始在北京的开放道路上开始收费运营,于2022年7月20日,萝卜快跑获得了在开放道路上就提供无人车服务(方向盘后面无安全人员)收费的许可。2022年12月30日,萝卜快跑首批获准在北京开展全无人自动驾驶测试,令百度在首都的公共道路上向公众提供无人车服务更近一步。
02业绩概览
2022财年,百度核心业务营收为954亿元人民币,与2021年基本持平。其中,在线营销业务营收为695亿元人民币,同比下降5.95%。
非在线营销收入方面,2022年的整体营收为259亿元人民币,同比增长22%,主要由云计算和其它基于AI驱动的业务推动。
百度2022年Q4营收331亿,与2021年同期持平
从2021-2022年各季度数据来看,百度2022年第四季度营收为331亿元,基本与2021年同期持平,较第三季度的325.4亿元增长2%。
其中,2022年第四季度来自百度核心的收入为257亿元,来自爱奇艺的收入为76亿元。
百度2022年Q4成本与费用284.84亿,同比降8%
百度2022年第四季成本与费用为284.84亿元,较上年同期的311亿元降8%。
其中,百度2022年第四季度成本为169亿元,较上年同期下降2%;销售、管理费用为59亿元,较上年同期下降9%;研发费用为57亿元。公司销售及管理费用、研发费用、财务费用占营业收入比重分别为16.6%、18.9%、-1.5%,研发费用率较2021年同期保持稳定,销售及管理费用率有所下降。
百度Q4运营利润46亿,运营利润率16%
百度2022年第四季度运营利润为46亿元,其中,百度核心的运营利润为38亿元,运营利润率为16%;百度2022年第四季度Non-GAAP下运营利润为65亿元,Non-GAAP下百度核心的运营利润为55亿元,实现了同比增长。
百度2022年第四季度其他收益为18亿元,其中有一项长期收益,达16亿元。
百度Q4净利50亿,较上年同期大幅改善
同样从2021-2022年各季度数据来看,百度2022年第四季度归属于公司的净利润为50亿元,较上年同期大幅改善;百度2022年第四季度Non-GAAP下归属于公司的净利为54亿元。
百度2022年第四季AdjustedEBITDA为82亿,adjustedEBITDA率为25%;其中,百度核心AdjustedEBITDA为71亿,adjustedEBITDA率为28%。
截至2022年12月31日,百度持有现金、现金等价物、受限制现金、短期投资为1853亿元。
2.1利润增加的主要原因是降本增效与精简运营
财报显示,得益于持续的降本增效、精简运营,2022年下半年,百度核心经营利润(非美国通用会计准则)同比增长14%;在国内公共卫生防控冲击宏观经济的第四季度,百度经营利润、经营利润率也均实现同比增长。
2022年,百度在搜索市场的份额依然遥遥领先,且APP月活跃用户指标保持了正增长。根据statcounter统计数据,百度去年仍以超过85%的超高份额位居中国移动搜索市场份额位居榜首。而截至年末,百度APP月活跃用户达到6.48亿,同比增长4%。
百度智能云在2023年一季度实现了盈利(non-GAAP),收入同比增长8%至42亿元。与此同时,百度智能云持续为关键客户构建标准化、规模化的人工智能解决方案,推动了智能云利润的增长。
2.3非在线营销收入整体营收增长迅速,主要由智能云、AI业务推动
2022年,百度核心营收中,非在线营销收入259亿元,同比增长22%,占该年度总营收的21%。代表着智能云及其他AI业务的非在线营销收入呈总体上升趋势,在四个季度中,分别占总营收的20.07%、20.6%、20%、23%。
同时财报显示,2022年百度核心研发费用达到214.16亿元,占百度核心收入的22.4%。其中Al业务是重中之重。
一方面,作为百度AItoB业务的承载者,百度智能云通过对行业特定痛点的理解,提供深入核心场景的标准化AI解决方案,实现了市场份额的领先。“云智一体”战略体现出更强竞年力百度智能云已连续四年AI公有云市场第一,2022年上半年在Al公有云服务市场份额占比28.1%。
另一方面,百度自动驾驶业务稳步推进。自动驾驶开放平台Apollo正式推出全新升级版本8.0;自动驾驶出行服务平台萝卜快跑订单量同比大增162%,截至2023年1月底,萝卜快跑累计订单量超过200万单,稳居全球最大的自动驾驶出行服务提供商。
2.4百度在卸下包袱,而文心一言则是国内最有可能复刻ChaGPT的产品之一
2022年百度核心研发费用达214.16亿元,占比百度核心收入比例的22.4%,已官宣加入百度文心一言生态圈的企业达400+家,AI已成为百度大厦中愈发重要的一块基石,真金白银的持续投入,也正在转化为产业化成果。
文心在大模型已进入ERNIE3.0系列、跨模态系列等底座模型日渐成熟,模型层基础扎实。2022年11月底,飞桨平台上己凝聚535万开发者、创建67万个Al模型,服务20万家企事业单位,在AI内容生态上都为文心一言提供了多元的使用场景。
对于百度来说,文心一言发布后,能够直接应用于自身产品的使用中,提升产品力。百度的搜索业务、智能驾驶业务都将受到加持,百度智能云也接入文心一言,提升B端服务能力。除此之外智能语音、数字人等都将通过文心言获得新的可能。
03AIGC角度市场分析
自2022年StableDiffusion模型的进步推动AIGC的快速发展后,年底,ChatGPT以“破圈者”的姿态,快速“吸粉”亿万,在全球范围内掀起了一股AI浪潮,也促使了众多海外巨头竞相发布属于自己的大模型。
而在国内,百度、阿里、华为、腾讯等公司也已在浪潮赶来之前就有所布局:
2019年,阿里开始布局大模型研发,去年9月发布“通义”大模型系列的众多大模型;华为在2021年基于昇腾AI与鹏城实验室联合发布了鹏程盘古大模型,是首个全开源2000亿参数中文预训练语言模型,在知识问答、知识检索、知识推理、阅读理解等文本生成领域表现突出;而腾讯的思路也与阿里相似,发布了混元AI大模型;第二梯队的京东、网易、360、字节跳动等企业,也纷纷官宣了自己在AI大模型方面的布局。此外,北京智源人工智能研究院推出1.75万亿参数的悟道2.0,可以同时处理中英文和图片数据。浪潮信息和中科院也分别推出了相应的大模型等。
其中,百度是国内最早推出大模型的大厂。
目前,国内各大企业AI大模型系列主要的NLP语言大模型、CV大模型、多模态大模型已陆续推出并实现部分应用落地。百度文心大模型、华为盘古大模型、商汤大模型、阿里大模型都已陆续亮相。
百度与阿里对比
百度文心大模型:包含NLP大模型、CV大模型、跨模态大模型、生物计算大模型、行业大模型等。与Bing类似,文心一言有望优化C端用户搜索、创作体验;ToB方面,百度已开放大模型API接口,在文案、AI作画、开放域对话方面赋能企业。对于具体行业,百度推出文心行业大模型,以“行业知识增强”为核心特色。
阿里巴巴通义大模型:由通义-M6模型融合语言模型和视觉模型组成,率先应用在硬件终端天猫精灵和软件通义千问。通义大模型包括统一底座“M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大模型”,以及行业层面的不同垂直领域专业模型。在应用上,天猫精灵基于通义大模型推出拟声助手“鸟鸟分鸟”;对话式通义千问已经开始内测。
作为国内大模型训练规模最大的两家巨头,百度的文心大模型与阿里的通义千问形成对标,基于当前的发展也积累出了一些对比:
首先,在面对用户提出的问题时,通义千问与文心一言在绝大多数情况都可以给出较为正确的回答,在面对C端用户的提问时,两个产品显示出了不相上下的实力。而在C端的势均力敌之下,阿里却祭出了同类竞品难以比拟的B端服务能力。
通义千问在C端用户之外,专门针对企业用户发出了邀请共测,企业可基于通义千问打造专属大模型,在企业专属的大模型空间中,既可以调动通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。
具体而言,除了通用场景之外,企业由于业务特性的不同,对于大模型服务有特殊需求和要求,通义大模型如果变成企业专属的大模型,可以支撑企业各式各样的应用与服务。
阿里云希望通过产品化的方式,满足企业专属大模型从生成到部署全生命周期的需求。
对比来看,百度的优势体现在文心大模型在国内市场格局中较为领先。根据IDC发布《2022中国大模型发展白皮书》,百度文心大模型在市场格局中在产品能力、生态能力、应用能力等方面在国内较为领先。文心一言核心优势是对中文的理解。百度作为中国语境的搜索龙头,拥有有更多的中文语料数据参与训练。比如,文心一言可以针对“洛阳纸贵”这种容易产生歧义的成语,给出较为贴切的解释。可以用成语写出藏头诗,用四川话读出文章。
总的来说,两个模型在自然语言处理领域都有其独特的优势和不足,难以直接进行比较。但是,可以肯定的是,它们的出现和发展表明了中国在自然语言处理领域的实力和创新能力。
人工智能的基础层是数据和算力,数据由服务器和光模块存储和运输;算力由CPU、GPU、FPGA、ASIC等芯片支撑。
根据前瞻产业研究院的数据,未来几年内,中国人工智能芯片市场规模将保持年均40%至50%的增长速度,到2024年,市场规模将达到785亿元。
数字经济时代,算力无处不在。以芯片、服务器、云计算提供商为主的市场主体,共同构成算力产业的大图景。
中国算力产业正在进入新一轮发展周期,有两个变量将影响中国企业的全球竞争力。第一个变量是2022年全面启动的“东数西算”政策,目的是让算力像水电一样便宜简单易用,同时希望中国企业在国际产业链占据主动权。第二个变量是AI让智能算力需求爆发,智能计算正在重塑云、软件、芯片产业,还在影响其他产业的智能化转型。
中国拥有算力资源的两大主力军分别是国资背景的三大电信运营商(中国移动、中国电信、中国联通)、民营背景的几大科技公司(阿里、腾讯、华为、百度),两大主力军背后,是一条包括设备服务商、芯片供应商、芯片制造商的庞大算力产业链。如果力量分散且失衡,中国算力产业会在关键时刻被拉开差距。
当前算力距离AI应用存巨大鸿沟。根据OpenAI数据,模型计算量增长速度远超人工智能硬件算力增长速度,存在万倍差距。英特尔表示,目前的计算、存储和网络基础设施远不足以实现元宇宙愿景,而要想实现真正的元宇宙,目前的计算能力需量要再提高1000倍。
◎AI芯片作为算力的核心,规模保持高速增长
AI芯片为算力的核心,专门用于处理AI应用中大量计算任务的模块。根据艾瑞咨询,2022年中国人工智能芯片市场规模达到396亿元,预计2027年市场规模将达到2164亿元,CAGR为40.5%。国内AI智算中心等数字化基础设施不断完善,AI模型复杂度和参数量的快速提升,对计算能力要求不断提高,高性能人工智能芯片市场将保持高速增长。
3.3AI应用场景日渐丰富,产业链成长空间广阔
大模型借助“预训练+精调”等模式,用相比较大模型更少量的数据即可对下游应用赋能。预训练大模型基于海量数据的完成了“通识”教育。在具体应用场景下,借助“预训练+精调”等模式,应用模型用相比较大模型更少量的数据即可进行相应微调,高水平完成细分应用的任务。
企业由此借助AIGC技术提高生产效率,降低生产成本,利好下游垂类应用企业,目前AI应用领域:家居、金融、医疗、安防、交通、零售等;
伴随着ChatGPT的出现,带来的文本生成、代码生成、图像生成等能力将有效赋能至下游,减少人工成本,提高办公效率,有效助力企业降本增效;目前国内大厂加快多模态大模型的研发落地,并与众多企业合作,下游应用场景将不断拓展,未来人工智能具备广阔的市场空间。
04未来发展展望
优异成绩令市场瞩目,各大机构纷纷上调了业绩预测
文心一言的发布至关重要,与百度智能云、搜索服务的结合将会给国内AIGC带来新的可能
目前,百度的主营业务仍是搜索,但AI正在为百度的营收提供有力支撑。
云业务的发展趋势将是更加智能化,仅非带宽和算力的简单提升。文心大模型或颠覆云服务市场的现状,而生成式AI技术将为百度智能云业务打开新的成长和想象空间。另外,大模型技术未来与自动驾驶的结合还将进一步提升自动驾驶的安全性和可靠性,搭载到Apollo智驾平台则可以优化新一代人车语音交互体验。
百度在全球AI领域的布局具备前瞻性,新的增长值得期待
百度在全球大厂中率先发布对标ChatGPT的大模型产品文心一言,具备在全球AI领域布局的前瞻性。并且,文心一言内测一个多月,就完成了4次大的技术升级,大模型推理性能提升近10倍。
百度创始人、董事长兼首席执行官李彦宏在5月4日百度内部活动中表示,百度之所以能够在Google、Meta、Amazon等大厂之前率先发布生成式大模型产品,是因为百度在芯片、框架、模型、应用等四个层面做到全栈布局、层层领先。
李彦宏:未来文心一言将通过百度智能云对外提供服务,这将是百度“云智一体”战略的里程碑,也意味着云市场游戏规则的根本性改变。云服务从数宇时代跃迁至智能时代,之前选择云厂商更多看算力、存储等基础云服务,未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同。
目前,已经有包括互联网、媒体、金融、保险、汽车、企业软件等行业的400多家头部企业宣布加入百度“文心一言”生态。随着文心一言等通用AI产品的技术迭代和成本降低,未来百度智能云将突破更多核心场景。