金融的大模型时代!技术路径是什么?海内外又有哪些应用?智库

AI与金融的结合主要有两条技术路径,分别是通过金融语料训练的金融大模型和金融垂类大模型。双方优劣具有相对性,而通用大模型通过金融语料训练超越金融垂类模型可能性较小。

在金融垂类模型上,国外彭博BloombergGPT率先登场;国内金融垂类模型百花齐放,例如恒生电子进一步升级金融大模型LightGPT,东方财富、同花顺加大AI研发技术投入等。

目前各家公司都在致力于以大模型赋能股基APP或是金融终端,为已有功能注入AI能力,实现多场景应用。在金融科技支持政策陆续出台、海外金融垂类模型加速落地的背景下,我们认为,金融垂类模型将成为金融科技领域未来的发展重点。

作者:胡翔(东吴证券非银行金融首席分析师)武欣姝(东吴证券非银行金融研究组研究员)

当前,国内互联网企业、传统金融机构及金融科技企业争相竞逐,“百模大战”如火如荼,AI与金融的结合也日益深化。

01

国内外大模型现状:OpenAI、微软引领业界,国内多家企业推出产品

百度具备先发优势,文心大模型国内领先。文心一言目前已拥有7000万用户。4.0版本能力栈较为广泛,可应用的场景较多,在查询搜索知识应用等方面表现不俗。阿里发布通义千问2.0,专业能力较强。可应用于相对复杂的场景。

从国内外通用AI大模型的发展历程来看,发展趋势是国外领先,国内紧追。

综合表现上,头部模型国外领先,平均水平国内外差距较小。所有模型中,GPT4-Turbo遥遥领先,国内最好的大模型为百度文心一言,但二者仍有一定差距。国产大模型虽与国外有所差距,但平均水平上与国外差距并不明显。此外,国内开源大模型在中文上的表现要优于国外开源大模型。

而在金融领域上,通用大模型的应用表现各有差异。

02

AI金融竞争:百模大战如火如荼,两条技术路线各有千秋

国内互联网企业、传统金融机构及金融科技企业争相竞逐,当前竞争较为白热化。2023年5月中旬,奇富科技首先宣布推出金融行业通用大模型奇富GPT,号称“国内首个金融行业通用大模型”。2023年5月,度小满推出国内首个千亿级中文金融大模型“轩辕”。恒生电子于2023年6月发布了金融大模型LightGPT,并对其进行升级,形成“LightGPT+WarrenQ+光子”体系。2023年9月7日和9月8日,腾讯混元大模型和蚂蚁金融大模型相继正式亮相。2023年11月,幻方量化旗下DeepSeek推出DeepSeekLLM67Bt,相较于其他金融模型拥有更突出的推理、数学、编程等能力。2024年开年之初,同花顺和东方财富分别推出问财HithinkGPT和妙想金融大模型。

当前AI与金融的结合主要有两条技术路径,一是通用模型和金融语料训练融合的金融大模型,二是金融垂类大模型。那么,通用和金融融合的大模型与金融垂类大模型相比,优劣势各是什么?

由于设计和训练目的不同,通用语言大模型与金融垂类模型在优劣上具有相对性。通用语言大模型在泛用性、灵活性、数据利用率、迁移性上相比金融垂类更有优势,而在专业性、针对性、高精度和合规性上,金融垂类模型更胜一筹;在复杂度问题上,通用语言大模型在结构上更加复杂,金融垂类模型则在更新维护上具有复杂性。

图表:通用与金融垂类大模型优劣对比

两种模型相比,通用金融模型经过训练超越金融垂类模型的可能性较小。

首先,使用金融数据对通用大模型进行训练,数据欠缺,成本过高。金融领域的语料应该充分覆盖各种金融产品、市场情况和业务流程等。通用大模型缺少金融数据进行训练,金融专业知识不足;另外,如果从底层开始训练大模型,需要投入的算力成本非常高。

第四,金融领域对合规性和风险控制要求极高。金融领域对于数据保护、隐私和风险控制具有严格的要求,专门训练的金融垂类大模型可能会更好地满足这些合规性需求。

度小满CEO许东亮曾表示:“通用模型难以胜任金融领域任务,金融大模型是大模型落地金融行业的必由之路”。

03

国内外通用大模型在金融领域的应用表现

金融大模型始于BloombergGPT,当前国内外金融行业都在主动拥抱大模型。国际数据公司IDC的一项调研显示,超半数的金融机构计划在2023年投资生成式人工智能技术。包括BloombergGPT在内,国外已出现了一系列金融大模型。而国产金融大模型也分出了两大“流派”,一派来自于传统金融机构,另一派来自于金融系科技企业或互联网企业。

从国内外案例来看,彭博BloombergGPT率先登场,金融任务的表现远超通用模型。

2023年3月底,彭博构建了最大的特定领域数据集,并训练了专门用于金融领域的大语言模型(LLM),开发了拥有500亿参数的语言模型BloombergGPT。BloombergGPT的混合训练方法使其模型在金融任务上的表现大大超过了现有的大语言模型,而在通用场景上的表现则与之相当,甚至优于现有模型。

彭博BloombergGPT相比于通用大模型的优势在于,该模型对金融领域理解更为深刻,具有深度专业的分析能力,同时通过协助优化金融自然语言处理(NLP)任务,提升彭博终端数据的应用价值,开辟金融行业分析和决策的新可能性。

在这之后,AI4FinanceFoundation开发了FinGPT这个金融领域的语言模型。FinGPT采用以数据为中心的方法,强调了数据采集、清理和预处理在开发开源FinLLM中的关键作用。通过支持数据可访问性,FinGPT渴望加强金融领域的研究、合作和创新,为开放金融实践铺平道路。FinGPT的最后一个组成部分是应用层,旨在展示FinGPT的实际适用性。它为金融任务提供实践教程和演示应用程序,包括机器人咨询服务、量化交易和低代码开发。

国内金融垂类模型也有一些经典案例。

恒生电子的LihgtGPT金融行业大模型,是一个更专业、更合规、更轻量的模型。LightGPT拥有更专业的金融语料积累处理和更高效稳定的大模型训练方式。在金融专业问答、逻辑推理、超长文本处理能力等在内的金融大模型能力评测中均有不错表现,能保证内容和指令的合规安全,可以为多种金融业务场景提供底层AI能力支持。

其中,光子系列产品是基于LightGPT能力,致力于在合规审核、投研算法、客户服务和营销分析方面成为金融从业人员的智能助手。

WarrenQ系列产品则是一款投研效率工具产品,旨在提高研究员的工作效率和实现知识高效协同。基于大模型叠加搜索和金融数据库,通过对话指令,可轻松获得金融行情、资讯和数据,且每一句生成的对话均支持文本溯源。ChatMiner可以帮助快速提取文档中的信息,提供精准检索与定位,精炼或拓展文本。

恒生电子的LightGPT和WarrenQChat产品优势有三方面。一是金融领域生成能力强。基于2000亿中文tokens的加持,超过80个中文金融任务的打磨,可覆盖了金融绝大多数领域应用场景,针对性强,回答速度极快,准确率较高,并支持多种语言输入与输出。二是合规性、安全性高。充分学习中国的金融法律法规,在输出时符合中国金融市场的监管要求。三是轻量化。支持私有化或云部署以及灵活API调用,推理端仅需一机2卡部署。金融机构可以打造机构专属大模型,满足个性化需求。

东方财富则重磅打造妙想金融大模型,致力于满足各类金融场景需求。

妙想金融大模型,使用Decoder-only的Transformer网络结构,支持32K的上下文长度,满足各类金融场景下的需求。通过自建的数据治理和数据实验流程,结合效果预估算法、高效预训练框架、SFT、RLHF训练等技术,妙想金融大模型建立起自主研发的技术壁垒。目前,妙想金融大模型已经可以分别适配不同的应用场景,提高模型应用的效费比。

同花顺在PC端、手机端双边发力,打造多场景应用AI功能集合。

2023年12月6日,同花顺开启了问财升级版的内测,底层已经升级为HithinkGPT大语言模型,结合海量金融领域数据和知识,通过自然语言对话,协助投资者进行标的选择、标的诊断等全方位投顾服务。基于超过3000万的月活流量,以及B端产品iFind业务的快速增长,同花顺大模型有丰富的落地场景。

当前,iFinD产品实现了基于语音交互与智能搜索服务、机器阅读研报、研报知识图谱自动生成等一整套智能化解决方案,预计iFinD+大模型将结合基础功能补齐,性价比优势有望引领中期份额突破;同花顺AI开放平台目前可面向客户提供多项AI产品及服务。

04

投资机会:金融垂类模型百花齐放,技术领先、数据丰富的企业将持续受益

伴随着金融大模型应用的不断深化和拓展,当下金融大模型已经不局限于文本生成和虚拟客服等领域,而是开始广泛应用于金融资讯发布、产品介绍内容创作等。展望未来,随着更多的金融大模型陆续落地,将采用更加精细化处理行业细分场景,同时孕育出新的应用场景,为传统业务注入新活力,也为金融领域带来新的业务机会。这将全面提升金融服务的效能,推动金融业务生态的全面重塑,为金融行业持续的前进和革新铺平道路。

我们认为,2024年金融垂类AI大模型将迎来前所未有的蓬勃发展,形成一番百花齐放的景象。而具备AI模型技术领先优势、较大金融交易数据基础、较好应用场景入口、积极推进AI模型构建的金融科技企业将持续受益。

本文所提及的任何资讯和信息,仅为作者个人观点表达或对于具体事件的陈述,不构成推荐及投资建议,不代表本社立场。投资者应自行承担据此进行投资所产生的风险及后果。

《新财富》杂志于2001年3月创刊,专注资本市场深耕细作,“最佳分析师”“金牌董秘”“500创富榜”“最佳上市公司”“最佳投行”等权威专业评选和《德隆系》《明天帝国》《收割者》等经典研究案例影响深远。

新财富杂志社旗下主要新媒体平台包括:新财富杂志微博、新财富杂志公众号、新财富杂志视频号。

地址:深圳福田区华富街道莲花一村社区皇岗路5001号深业上城T1栋59楼

THE END
1.1毫秒屏幕响应时间有什么用?华硕商城 在得物App发布了一条热门动态!快来围观,就等你啦!https://m.dewu.com/note/trend/details?id=253438965
2.飞利浦艾维尼亚评测——响应时间为什么比刷新率重要?飞利浦艾维尼亚评测——响应时间为什么比刷新率重要?,于2024年12月5日上线。抖音精选为您提供高清视频,画面清晰、播放流畅,看丰富、高质量视频就上抖音精选。https://jingxuan.douyin.com/m/video/7444837655042460937
3.电视机选择画面清晰度色彩饱和度与响应时间的重要性探究响应时间通常指的是从开启到显示内容所需花费的时间。对于游戏爱好者来说,这个参数尤为重要,因为快速反应是游戏中的一大要素。如果电视机响应慢,可能会导致玩家错过关键瞬间,从而影响游戏成绩。而且,在观看直播或视频内容时,如果响应速度快,可以减少卡顿现象,使得整体观看流畅性得到提升。 https://www.yxouu.cn/ce-ping/105581.html
4.解释常用的性能指标名称与具体含义响应时间:即系统响应时间(Transaction Response Time),应用系统从发出请求到客户端接收到响应所消耗的时间,是用户视角最关心的软件性能业务体验。响应时间为网络响应时间与应用程序响应时间之和; 一般响应时间在2s内,用户会感觉比较满意; 在2s~5s之间,用户勉强能接受; https://blog.csdn.net/NHB66666666/article/details/144399824
5.如何评估中间件的性能和质量?评估中间件的标准有哪些?股票频道评估中间件的标准有哪些? 在当今的信息化时代,中间件在系统架构中扮演着至关重要的角色。为了确保系统的高效稳定运行,准确评估中间件的性能和质量显得尤为重要。 评估中间件的性能,首先要考虑其响应时间。响应时间是指从发送请求到收到响应所经过的时间。较短的响应时间意味着中间件能够快速处理请求,提供更流畅的服务https://stock.hexun.com/2024-12-06/216014901.html
6.显示屏响应时间有什么用,重要不重要4条回答:【推荐答案】一般电脑上网运行办公软件没多大关系,当你看电视动作片或玩游戏时这个响应时间就有用了,因为响应时音慢的会感觉不畅疑滞。https://wap.zol.com.cn/ask/x_9941852.html
7.北京科技大学信息化建设与管理办公室响应时间: 1m、5ms、12ms 色域:100%SRGB、75%NTSC 色深:8bit、10bit 色准:ΔE/JNCD(显示和真实差距) 屏幕亮度和对比度HDR TN、VA、IPS面板那种更好? 二、显示器的进阶知识 G-Sync、Free-Sync 干啥用的? VGA、DVI、HDMI、DP、Type-c 显示器如何才不伤眼睛? https://info.ustb.edu.cn/ITxy/APIml/35a819e90429420c8e7d22e08a803b3b.htm
8.产权证有什么用案:产权证是房屋合法权利的凭证,具有重要作用。分析:产权证是权利人依法拥有房屋所有权,并对房屋行使https://www.findlaw.cn/wenda/q_46649486.html
9.什么是最大内容绘制(LCP)以及如何有效地优化第一类问题涉及服务器响应时间,也就是首个字节的时间(TTFB)。在用户的浏览器能够考虑加载主要内容之前,它首先需要从服务器上得到一个响应。 以下是影响这一点的一些常见问题。 不使用页面缓存– 不使用页面缓存迫使服务器在响应HTML文档之前做更多的 “工作”。 https://www.wbolt.com/largest-contentful-paint.html
10.请问船员有什么用,招几十个,一个人影都没见到x4基石吧请问船员有什么用,招..勤务船员可以修复舰船耐久以及飞船上被打坏的组件(但是需要满级才能修满血),影响舰船响应时间(没有充足船员的船反应会比较慢),提高矿船的采矿效率https://tieba.baidu.com/p/8584828566
11.OpenAI的新o1preview和o1mini模型有什么更新?如果你想更深入地用Python测试o1模型,可以在这里阅读更多相关内容:这里。 比较响应时间及令牌数量 响应时间 GPT-4o— 5 秒 o1-preview— 20 秒 GPT-4o mini— 4 秒 o1-mini— 11 秒 由于其推理能力,o1 模型生成响应所需的时间显著更长。 令牌 https://www.imooc.com/article/359062
12.头条文章无论是由于信号干扰,硬件质量引起的从站掉站或是由于工程需要暂时关闭站点,此时都会由于“各站点连接时间”的增加而使通信系统的轮询时间大大延长。在S7-1200的Modbus RTU通信中,主要有三个参数与“各站点连接时间”的设置相关。 1. 从站响应时间 RESP_TO https://card.weibo.com/article/m/show/id/2309404603050156228867
13.使用事件系统和DMA来消除中断可实现超快响应时间和极低功耗在一个中断频繁和数据量大的应用中,带有事件处理器和DMA的微控制器可节省90%的功耗。 有/无事件系统和DMA之MCU的处理周期和功耗比较见表3。 表1,有/无事件系统之MCU的处理周期和响应时间比较 表2,有/无DMA的MCU传输350 KBps数据时的典型MIPS和功耗 表3,传输350Kbps 数据的中断、MIPS和功耗比较http://www.chinaaet.com/article/43000
14.Java线程之间的共享与协作详解java当谈论并发的时候,一定要加个单位时间,也就是说单位时间内并发量是多少?离开单位时间其实是没有意义的。 俗话说一心不能二用,这对计算机也一样,原则上一个CPU只能分配给一个进程,以便运行这个进程。我们通常用的计算机只有一个CPU,也就是说只有一颗心,要让它一心多用同时运行多个进程,就必须使用并发技术。实现并https://www.jb51.net/article/253806.htm
15.电视机功率及耗电量是多少响应时间也很重要,它会决定在显示高速动态画面时是否会出现模糊和拖尾现象,目前主流的8毫秒响应时间已经可以满足使用要求。一般来说反应时间越快,液晶电视就会越少出现拖尾、残影现象。最好在购买前看看实际播放动作片的效果。 5、硬屏好还是软屏好 单凭“软、硬”并不能很准确的分辨液晶面板的好坏。目前确实有一些https://www.jy135.com/jiadian/43857.html
16.APP接口有什么用呢?APP接口使第三方开发者能够构建应用程序或服务,与您的应用程序进行集成。这有助于扩展您的应用程序生态系统,并为用户提供更多功能和选择。 8. 故障排除和性能优化 接口提供了一种有效的方式来监控和排除应用程序中的错误。通过监控API的响应时间和性能,开发者可以快速检测并解决问题,提高应用程序的稳定性和性能。 http://www.apppark.cn/t-48273.html
17.电竞显示器1ms响应时间真的有用吗?例如,一些策略游戏或角色扮演游戏可能对响应时间的要求不如射击游戏或竞速游戏那么高。因此,在选择电竞显示器时,还需要根据自己的游戏类型和需求来进行权衡。 总之,电竞显示器的1ms响应时间确实有用,但并非唯一决定因素。在选择电竞显示器时,还需要综合考虑其他参数和功能,以及自己的实际需求和预算。https://www.yoojia.com/ask/17-14278289503488300733.html
18.我有对方身份证号码有什么办法可以查到对方现在所用的手机号码吗?用身份证号查手机号是可以的,但是需要权限。因为我国公民的身份证系统属于公安局直接管辖,而手机号码则https://www.66law.cn/question/28299544.aspx
19.购买电视时QLEDUHD和OLED有什么区别?哪个是最好的?QLED 电视的响应时间通常为 2 到 8 毫秒,而 OLED 电视的响应时间要快得多,为 0.1 毫秒。 如果您想将其与游戏 PC 一起使用,OLED 电视绝对是您的不二之选。 什么电视尺寸最适合客厅? 房间的大小和与屏幕的距离决定了您需要的电视尺寸。 如果坐下: http://www.dayanzai.me/qled-vs-uhd-vs-oled.html
20.国内有哪些crm系统软件好用零代码企业数字化知识站技术支持:一个优秀的CRM系统应该有完善的技术支持和服务团队,以便在使用过程中提供及时的帮助和解决方案。企业在选择时,可以咨询软件供应商的服务保障和响应时间。 用户评价:在选择CRM系统之前,可以查阅一些用户的评价和案例分析,了解其他企业在使用该系统时的实际体验和效果。这对于企业做出最终决策非常有帮助。 https://www.jiandaoyun.com/blog/article/774949/