云原生PaaS,如何让金融业数字化开出“繁花”?

开通VIP,畅享免费电子书等14项超值服

首页

好书

留言交流

下载APP

联系客服

2024.01.31北京

在中国金融业数字化转型的历史长卷中,过去十年无疑是一部磅礴的史诗。

2017年,南京银行第一次将传统线下金融业务搬到了线上。那一年,它的互联网金融信贷业务实现了过去10年的业务总额。

2021年,富滇银行通过数字化转型,将整体业务全面线上化,再造了一个“线上富滇”。那一年,它的整体业务实现了过去7年首次超过两位数的增长。

一个个鲜活的案例,见证了中国金融业从互联网化迈向全面数字化的进程,而云计算技术的引入成为了这一进程中的关键驱动力。

近些年来,金融机构通过“上云”,使得IaaS层基础设施逐步完善,中国金融业数字化转型进入深水期。

但“上云”并非终点,反而是金融机构加速数字化转型、实现高效创新的开始。如何用好云,构建全新的“云上”应用体系,成为金融业数字化转型的新课题。

这也使得越来越多的金融机构将目光投向了更高一层的PaaS,尤其是基于云原生构建的PaaS技术,正展现出令人瞩目的发展势头。

据浙大AIF(AcademyofInternetFinance)最新发布的《金融行业云平台(PaaS)市场发展趋势白皮书》显示,云原生PaaS是一种创新的服务模式,旨在提高应用的开发、部署和管理效率,帮助金融机构优化成本支出和提高资源利用效率。

随着云原生PaaS技术在金融领域的深入应用和成熟,其在推动金融行业数字化转型的关键作用愈发显现。

那么,在IT基础设施变得越来越复杂、技术迭代越来越快的今天,云原生PaaS技术是如何在金融业数字化转型中发挥重要作用,又能否为金融数字化带来一场新的“繁花”?

据IDC《中国金融云市场(2022下半年)跟踪》报告显示,2022下半年,中国金融云IaaS市场规模美金同比增长13.2%;金融云平台(PaaS)解决方案市场美金同比增速为42.7%,增速在所有子市场中排名第一。

金融机构对PaaS的重视不足为奇。作为云计算架构的中间层,PaaS扮演着“承上启下”的中台角色,一方面能够降低底层基础设施的建设与管理成本,另一方面也能提高应用程序的灵活性和可伸缩性,加速新产品的上线周期。

而云原生技术的引入,更是让PaaS焕发生机,在可扩展性、可用性、可移植性等方面有了更优秀的表现。

近年来,越来越多的金融机构展开对业务系统的云原生改造,利用容器、微服务、动态编排、DevOps等云原生PaaS技术,初步形成以“应用”为中心的云计算新模式也是这个原因。

正如AIF执行副院长张瑞东所说,云原生对PaaS进行重新定义,让金融机构用云方式从“上云”向“云上”转变。

但值得注意的是,云原生PaaS并非字面意义上的“在PaaS层采用云原生技术”那么简单。

在早期云原生建设中,不少金融机构是在IaaS虚拟化资源池之上,再建一个容器资源池,两层架构叠加并未充分发挥云原生PaaS的优势。

随着深度用云进程的加速,金融机构在PaaS层进一步遭遇“卡点”:

一是,多云多芯多端,对异构资源和应用的统一管控提出了更高要求。

在多云、混合云成为趋势的今天,金融机构大多采用多云战略,把鸡蛋分散在不同的篮子里以降低风险。但多云也带来了运维复杂、运维管理成本高、操作体验差等问题。

同时,国产化的推进,使得金融机构信息系统建设已经从以小型机和x86架构为主,进入到了“一云多芯、一机多芯”的新阶段。

碎片化的芯片,不仅会造成管理复杂性增加、成本增加,也很难被云原生应用进行统一资源调度和使用。

从业务的视角看,金融服务从线下转向了线上全渠道,APP/H5/小程序、Android/iOS/鸿蒙等多种终端生态,需要被统一打通和投放,对应用开发和运维效能提出了很高的要求。

总的来说,“多云多芯多端”的架构,带来了大量复杂的异构系统,包括云形态、资源、应用架构、芯片、终端的异构,都会造成管理复杂性增加、成本增加,成为平滑统一上云、用云的障碍。

因此,底层异构资源的复杂性、新老系统架构出现交集、应用体系的开发运维效率,是金融机构上云后在PaaS层需要持续解决的新问题。

二是,AI快速发展,加速智能化服务和应用的诞生。

如今金融行业越来越依赖于AI技术来提高业务能力、客户服务和风险管理等方面的效率。

例如,利用PaaS技术中的AI功能,金融机构可以开发智能顾投、智能核保、风控营销等服务,提供强大的数据分析和智能决策支持。

通过整合多媒体技术,智能客服、数字人等服务,可以为客户提供更加生动的、个性化的解决方案,提高用户理解和接受新金融产品的意愿。

随着AI技术的不断发展,PaaS平台正在进一步提供自动扩展、智能监控、自动故障处理等方面的能力,以提高金融服务应用的效率和稳定性。

而现在,大模型技术快速发展,使得“所有的业务都值得被重做一遍”。理论上,金融业的应用灵活创新、个性化用户交互、高效信贷流程、产品敏捷开发与交付等环节,都可以通过大模型重构。

但新技术出现到落地产业还需要适配的产品化工具的助力。大模型的应用也意味着对算力的需求。有调研数据显示,AI的应用对于GPU算力的需求每三个半月翻番,但GPU的利用率通常不足30%。

而目前我国正面临出口禁令导致的芯片短缺,充分发掘GPU资源潜力、提高资源利用率迫在眉睫。

如何用AI的方式进一步提高企业在运营、运维、生产等各个业务环节的效能,尤其是用大模型结合上云提高智能化的能力,是金融机构需要利用AI和PaaS等技术亟待解决的重要问题。

三是,“下云潮”争议背后AI算力紧缺等现状,进一步显现“降本增效”的强烈需求。

尽管大多数企业将“上云”作为数字化建设的重要指标,但也有少量企业开始“下云”以节约成本、提高效率。

这也从侧面反应出现阶段用云的投入产出比还不够高,如何提升云的资源利用率,降低云的技术风险,更好地支撑业务,对PaaS技术提出了更高的要求。

四是,政策监管加码,对安全合规能力要求更高。

数字化转型的深入推进,使得金融机构的IT系统越来越复杂,数据的关联性、交叉性持续增强,客观上增加了金融数据泄露的风险。

同时,对于部分新技术产品的安全性考虑不足,也可能存在未知安全隐患。

随着网络安全法、个保法、数据安全法等法律法规的落地实施,金融市场监管逐步趋严。在安全合规前提下开展云平台建设成为金融机构的必答题。

不难发现,无论是技术迭代、市场变化,还是政策导向,都在推动PaaS技术向更加多云、智能、绿色、可信的方向发展,使得金融机构能够在竞争激烈的市场中保持领先地位。

但无论是全栈云还是独立PaaS平台,金融机构要的是更灵活、更高效的数字化基础设施,因此PaaS的服务形式不重要,重要的是PaaS的成熟度。

从这个层面来看,蚂蚁数科已经悄然成为PaaS赛道中的佼佼者。据2022年IDC《中国云原生市场分析》报告显示,蚂蚁云原生PaaS平台SOFAStack是国内云原生技术覆盖最全面的厂商之一。

在产业应用层面,被国内超60%的TOP50金融机构持续使用,包含6家国有大型商业银行、11家股份制银行,是市场主流选择。

之所以蚂蚁PaaS平台能够被金融业广泛应用,很重要的原因在于它是依托于支付宝、蚂蚁集团孵化成长出来的,从支撑移动支付、金融业务中来,经过了蚂蚁集团十多年的架构充分迭代和验证。

而2018年蚂蚁集团全面转向云原生,也使其PaaS技术走在了业界最前沿。

浙大金融科技研究院经过调研后,副院长张瑞东在白皮书发布现场评价道,现阶段金融机构在数字化转型中遇到的“卡点”是可以解决的,蚂蚁PaaS平台为金融机构提供了二次开发和工具高度集成的良好开发环境,可以很好地解决金融数字化转型、实现高效创新中的痛点。

针对“多云多芯多端”带来的异构资源和应用,蚂蚁在自身实践经验的基础上,定义了下一代的统一资源调度架构——打通虚拟化和容器层的资源池,将原有上下叠加的关系改变为共池关系,用统一的引擎去调度,通过屏蔽复杂异构的资源管理,同时让应用能够在统一的操作系统之上纳管。

换句话说,不管是物理机、虚拟机、OpenStack还是阿里云、华为云等公有云、专属云,不管是国外还是国产的芯片、操作系统,不管是单体式的应用还是微服务的应用,不管是C语言、Java还是Python,蚂蚁SOFAStack都可以全面兼容。

同样,蚂蚁自主研发的端云一体一站式移动开发平台mPaaS,也能够全面兼容海光CPU、麒麟软件NeoCertify、鸿蒙等数十家国内主流操作系统、CPU等软硬件。

这种全新的统一架构,使得系统性能得到更大提升,同时降低碎片化,提高资源利用率。

为了支持应用在上云之后能够更平滑、稳定的运行,蚂蚁正在借助AI技术推进云原生的应用实现“自动驾驶”。

通过引入AI技术识别、对比基线,去禁入和限流,引导流量的压力水位快速、自动下降到健康的区间。

一旦流量异常情况危险警报得到解除,限流智能模块将自动退出。整个过程对于运维人员和终端用户是无感的。

同时,基于大模型将为研发效能带来颠覆性机遇的判断,蚂蚁已将自研的代码大模型CodeFuse与SOFA产品线全面融合,涵盖设计、研发、测试、运维等领域。

具体而言,企业客户在使用SOFAStack时,相当于为企业开发者配备专属智能副驾驶,和机器人“辅助设计”、“结对编程”、“运维助手”,通过人机交互助手提升日常代码研发、测试、运维过程中的效率和质量。

对企业而言,引入智能副驾驶可以显著提升人效质量,降低总体成本。

随着CodeFuse在产品线中不断深度融合,SOFAStack将为金融机构打造新一代AI云原生PaaS平台,使其在开发运维、数据分析、应用治理、绿色计算方面取得更智能的能力,加速响应业务创新和价值交付。

该技术通过无侵入的方式对老旧的应用植入sidecar,就能够让企业无需对传统应用做任何改造,不再需要高成本迁移,多云及云下系统即可实现互联互通。

Forrester首席分析师戴鲲对蚂蚁SOFAMesh产品进行深度调研后表示,通过研究三年数据测算,使用蚂蚁服务网格产品后,其客户投资回报率达到99%。

目前,该产品已服务超30家金融机构在IT生产运维环境中落地,包含中国工商银行、中信银行、民生银行、南京银行等,平均帮助客户内部研发运维效率提升20%+,线上大型故障减少20%+,并大幅降低研发成本。

不仅如此,蚂蚁还在进一步探索降本增效的可能性。

比如资源混合调度,进一步地把GPU资源进行池化,最大化利用GPU资源,同时针对在线应用、3D渲染类的应用进行CPU和GPU的混合调度,深度支持更复杂、更异构的业务的负载类型,缓解GPU短缺的现状。

再比如,离线混部技术、云原生分时调度、AI弹性容量三大技术,使得资源能够错峰配置、智能弹性扩缩,白天主要面向在线类计算应用,晚上侧重离线类大数据的应用,从而大幅度提高资源利用率。

在金融机构全面转向分布式和云原生技术的过程中,传统运维体系和平台能力已经不足以支撑正在变革的应用架构。

对此,蚂蚁创新性地提出了TRaaS技术风险防控体系,以满足金融业对于安全合规的严苛要求。

该体系以Risk(风险)为核心视角,对风险进行事前、事中、事后的预防和干预,如:事前的业务监控、故障演练,事中的快速止血、自愈以及故障自动定位跟踪;事后的风险溯源、回收定额等,保障基础设施的安全稳定运行。

总的来说,如今金融机构的基础设施呈现出多样化、多场景等特征,底层基础设施架构迥异,业务场景非常复杂。

金融云PaaS需要解决不止是开发敏捷的问题,还需要解决架构先进性,将金融对安全合规、交易强一致性、单元化扩展、容灾多活、全链路业务风险管理、运维管理等各方面行业要求,与云原生技术进行深度融合。

蚂蚁PaaS平台正是这样一套既符合金融行业标准和要求,同时又兼具云原生技术架构优势的产品,为金融机构深度用云提供了理想工具。

富滇银行与蚂蚁合作先后引进了旗下机构数字化升级“三件套”,即原生分布式数据库OceanBase、移动开发平台mPaaS和金融级云原生分布式平台SOFAStack,以满足金融业务对于高稳定和高性能的双重要求。

在分布式架构转型方面,通过蚂蚁SOFAStack解决方案能力加持,部署于“滇峰云”上的敏态应用均具备高并发弹性伸缩能力。

上线后的“滇峰云”提供122项平台层服务,支撑快速开发实现131个云原生应用,运行1100+个容器,可满足每分钟交易量峰值50万笔,每分钟交易量提升80倍。

与此同时,蚂蚁SOFAStack为富滇银行提供全体系的TRaaS服务,助力富滇银行面向技术风险的体系能力达到业内领先水平。

在风控与反欺诈创新方面,蚂蚁数科以中台化的建设思路,助力富滇银行建设了一套更加业务化、高效便捷的覆盖信贷全生命周期的风控运营平台,实现全渠道、全体系的数字化风控能力提升。

在手机App建设方面,蚂蚁mPaaS助力富滇银行优化用户体验、在非金高频场景和数字化运营方面发挥作用,使得手机银行用户活跃度大幅提升,MAU较年初增幅66%。

类似的成功案例还有很多,如中华保险、新华人寿保险以及某些国有大行、股份制银行,在云原生分布式体系建设方面都取得了突出的成绩,其背后都有蚂蚁的身影。

《金融行业云平台(PaaS)市场发展趋势白皮书》认为,金融行业PaaS发展呈现四大趋势:

一是,加强数据安全和隐私保护,强化合规和风险管理。金融行业需要PaaS提供先进的安全措施,帮助金融机构构建更加安全、可靠的信息系统,满足国家在法规和监管方面的要求。

二是,提高运营效率和灵活性,增强服务的可及性和可用性。

PaaS技术应当具备低延迟的特性,确保数据传输和处理的效率,以满足金融交易的实时性需求。未来金融行业还将结合AI应用,在数字化转型中将不断创新。

三是,整合多元系统,支持生态系统建设。金融业务的复杂性和多样性要求PaaS技术能够满足各种不同的业务需求,减少数据孤岛的存在,成为一个能够与多样化技术生态系统协同工作的平台。

四是,更加特殊的移动端设备管理和防数据泄漏的要求。

移动端包含大量不同型号和操作系统的设备,这要求PaaS平台能够有效应对各种设备和操作系统的差异。同时,移动端PaaS技术需强化本地数据的加密和安全存储机制。

对此,蚂蚁数科数据智能与科技事业群产品解决方案总监曹诗洋表示,蚂蚁数科会在保持架构先进性、融合AI大模型、降本增效、安全合规等方面持续发力,其目标是保证客户在云上云下能够自由切换,更好地支撑业务,在保持业务一致性和连续性的同时,降低成本和风险。

“我们正加速融合蚂蚁自研的可信AI、区块链、隐私计算等新技术,通过PaaS化科技服务帮助企业自建体系化数据应用能力,助力金融业迈入数据智能阶段”,曹诗洋表示。

同时,曹诗洋也认为,金融数字化转型不仅是技术问题,更是企业系统化工程,需要技术、组织、流程规范的整体配套,而云原生既是技术也是一种理念,蚂蚁提供全面的产品和服务与金融机构、产业伙伴一起实现高效转型。

THE END
1.强化学习ReinforcementLearning在航空航天领域的应用与挑战强化学习,Reinforcement Learning,航空航天,应用,挑战,控制,优化,决策 1. 背景介绍 航空航天领域一直以来都是科技发展的前沿阵地,其复杂性、安全性要求极高,对智能控制和决策的需求日益迫切。传统控制方法往往依赖于预先设定的规则和模型,难以应对复杂、动态变化的环境。而强化学习(Reinforcement Learning,RL)作为一种机器https://blog.csdn.net/2301_76268839/article/details/144429525
2.自然语言强化学习:一个可处理语言反馈的强化学习框架这种困境促使研究团队开始探索一个更具突破性的方向:能否设计一个框架,让 AI 系统完全通过与环境的交互来学习,而不依赖任何人类标注数据?传统强化学习为这个问题提供了灵感,但其单一数值奖励的机制难以满足复杂场景的需求。团队意识到需要一个新范式,既要继承强化学习的数学严谨性,又要具备自然语言的表达丰富性。这个https://hub.baai.ac.cn/view/41851
3.大数据上云存算分离演进思考与实践大数据阿里技术异构计算的资源负载混部:在统一存储平台提供面向异构计算的工作资源负载下的多维度查询分析服务。在线与离线计算共用计算和存储资源。解决资源波峰波谷问题,实现资源动态削峰填谷 存储降本: 存储利用率+冷热分层。支持基于分布式存储系统上的多层存储(热存储/标准存储/冷存储等)。举例来说,存储降本优化主要依赖于归档与冷https://xie.infoq.cn/article/de0971c840628b7b467a110dc
4.Volcano:在离线作业混部管理平台,实现智能资源管理和作业调度节点可观测性增强,对在离线任务资源布局动态优化,识别在线业务是否受到干扰,对干扰进行定位和控制。 集群可观测性增强,对集群任务布局动态优化,减少集群资源使用不均衡问题。 基于Volcano混合部署解决方案如下图所示: 图3 基于Volcano混合部署架构 Volcano混部调度能力 https://developer.huawei.com/consumer/cn/forum/topic/0202841185168780412
5.云计算:ChatGPT的“中枢神经”云原生离混部技术实现离散训练,在线微调 ChatGPT基于大量优质的数据语料训练,实现对话意图识别和内容生成能力的突破,这主要由于ChatGPT具有强大的智能算法学习和记忆调用基础,通过云原生离线混部和极致弹性调用机制,离线训练千亿级别的超大规模参数,形成了ChatGPT的存储记忆资源池,通过在线补充完成人类反馈强化学习(RLHF)的微调https://m.thepaper.cn/newsDetail_forward_22342649
6.在离线混部云容器引擎最佳实践调度在离线混部的核心目标是通过将在线应用和离线应用混合部署到同一个集群中,最大程度地提高集群的资源利用率,进而降低企业的运营成本。值得注意的是,在线应用和离线应用这两种不通类型的应用对服务质量的要求是不一样,在线应用往往是延时高度敏感,对资源质量要求也更高。而离线应用则对延迟要求相对宽松,有更好的重试容错https://www.ctyun.cn/document/10083472/10172926
7.阿里决战双11核心技术揭秘——混部调度助力云化战略再次突破在大家如丝般顺滑地完成一次次秒杀、抢购和付款过程的背后,是阿里巴巴技术团队经历数年时间的系统打磨,技术架构优化所做出的努力。而底层基础设施服务质量不断提升、IT 成本增加逐年递减的演进历程,都由一个名为「云化战略」的技术梦想所贯穿起来。 特别是 2017 年双 11,阿里巴巴首次混合部署了在线服务、离线计算以及https://www.leiphone.com/category/ai/HHa8Y9tPeVgB1Kt8.html
8.Kubernetes资源拓扑感知调度优化腾讯云开发者社区基于离线虚拟机的混部方案导致的节点实际可用 CPU 核心数变化 面对运行在线业务的云主机平均利用率较低的现实,为充分利用空闲资源,可将离线虚拟机和在线虚拟机混合部署,解决公司离线计算需求,提升自研上云资源平均利用率。在保证离线不干扰在线业务的情况下,腾讯星辰算力基于自研内核调度器 VMF 的支持,可以将一台机器上https://cloud.tencent.com/developer/article/2029446
9.浪潮云海首席科学家张东:面向一云多芯的系统设计云海云操作系统(InCloud OS)、Apsara Stack、EasyStack等通过单一资源池实现异构资源的统一调度和互联互通,但当前阶段主要解决“多芯”的混部问题,距离以应用为中心的跨架构运行和低成本切换尚有较大差距。为满足多芯共存条件下业务的稳定运行、平滑切换和弹性伸缩,如下科学问题和技术难题亟待解决。 https://www.cet.com.cn/itpd/itxw/3465583.shtml
10.便宜云服务器容器服务在AI智算嘲的创新与实践容器服务也在积极推动上游开源社区,在Kubernetes体系下,定义支持各类计算框架和任务类型的云原生任务标准API和生命周期。帮助用户可以在Kubernetes集群上以统一的标准和接口,管理调度各类数据计算类工作负载。 ACK扩展了Kube-scheduler framework,与Slurm调度系统打通,即支持节点池维度的分节点调度,也支持共享节点资源的混部调度http://zhanzhang.ceden.cn/?article/1644909
11.腾讯云专有云TCS容器平台企业级云容器平台云原生容器腾讯云专有云TCS容器平台,适配丰富异构IAAS设备,满足利旧需求,广泛适配兼容信创CPU/指令集/操作系统。自研高性能负载均衡;基于eBPF的高性能网络;跨集群统一服务发现;高性能Ingress;平台高可用和部署方案,运维运营能力。 立即咨询 传统企业信息化体系存在的问题 https://www.yun88.com/product/3926.html
12.华为云UCS华为云与本地IDC协同,实现弹性上云 构筑本地集群极速弹性上云,流量高峰,业务云上秒级扩容 结合Volcano以及HCE OS 2.0能力,构建本地集群在线、离线混部能力,资源利用率提升40% 在AI训练和AI推理场景下,通过GPU虚拟化技术实现GPU隔离以及资源利用率提升 云原生应用全景观测,大幅提升运维效率 https://www.huaweicloud.com/product/ucs.html
13.阿里云异构计算类云服务器介绍(GPU云服务器FPGA云服务器等神龙AI加速引擎AIACC是基于阿里云IaaS资源推出的AI加速引擎,用于优化基于AI主流计算框架搭建的模型,能显著提升深度学习场景下的训练和推理性能。配合集群极速部署工具FastGPU快速构建AI计算任务,全面提升研发效率和GPU利用率,缩短计算时间并降低AI的推理延迟。 2、神龙AI加速引擎AIACC产品优势 https://www.jianshu.com/p/d4c370053533
14.深入硬件层内核态与用户态,一文看懂火山引擎云原生操作系统近日,在2020全球分布式云大会上,火山引擎解决方案总监于鸿磊以“多云环境下的云原生操作系统”为主题,从云原生操作系统出发,分享了火山引擎敏捷高效的基础设施与技术,为企业追求业务持续增长的提供了一种创新技术思路。 激发创造,释放潜能 字节跳动具有长期沉淀、服务于数亿用户的大数据技术、人工智能等基础技术服务能力,拥https://www.volcengine.com/docs/6316/66821
15.小红书近线服务统一调度平台建设实践对于服务,我们目前将服务划分为强隔离要求在线服务、普通在线服务、近线服务、离线服务4个QoS级别。 服务QoS 资源保障模型,本质上就是按照服务的 QoS 级别,给予不同的算力保障。 对于近线服务,调度优先级为:独占资源池机器 > 在线集群闲置算力 > 混部算力 > 公有云容器实例服务。目前公有云容器实例服务,只是作为一https://blog.itpub.net/70016482/viewspace-2927565/
16.成立3年,云服务厂商火山引擎全景扫描该服务属于实时计算方面,完全基于云原生构建:脱胎于抖音内部超大规模实践,日常峰值 QPS 达100亿,稳定性提升51%;通过Serverless,实现弹性扩缩容和在离线业务混部,资源利用率提升40%;并且能够统一调度,满足流批一体等多种计算模态。通过LAS和Serverless Flink,企业可以更加高效、经济的建设自身的数据底座。https://www.eefocus.com/article/1512934.html