金融的大模型时代！技术路径是什么？海内外又有哪些应用？智库|响应时间有什么用_在线平台

AI与金融的结合主要有两条技术路径，分别是通过金融语料训练的金融大模型和金融垂类大模型。双方优劣具有相对性，而通用大模型通过金融语料训练超越金融垂类模型可能性较小。

在金融垂类模型上，国外彭博BloombergGPT率先登场；国内金融垂类模型百花齐放，例如恒生电子进一步升级金融大模型LightGPT，东方财富、同花顺加大AI研发技术投入等。

目前各家公司都在致力于以大模型赋能股基APP或是金融终端，为已有功能注入AI能力，实现多场景应用。在金融科技支持政策陆续出台、海外金融垂类模型加速落地的背景下，我们认为，金融垂类模型将成为金融科技领域未来的发展重点。

作者：胡翔（东吴证券非银行金融首席分析师）武欣姝（东吴证券非银行金融研究组研究员）

当前，国内互联网企业、传统金融机构及金融科技企业争相竞逐，“百模大战”如火如荼，AI与金融的结合也日益深化。

国内外大模型现状：OpenAI、微软引领业界，国内多家企业推出产品

百度具备先发优势，文心大模型国内领先。文心一言目前已拥有7000万用户。4.0版本能力栈较为广泛，可应用的场景较多，在查询搜索知识应用等方面表现不俗。阿里发布通义千问2.0，专业能力较强。可应用于相对复杂的场景。

从国内外通用AI大模型的发展历程来看，发展趋势是国外领先，国内紧追。

综合表现上，头部模型国外领先，平均水平国内外差距较小。所有模型中，GPT4-Turbo遥遥领先，国内最好的大模型为百度文心一言，但二者仍有一定差距。国产大模型虽与国外有所差距，但平均水平上与国外差距并不明显。此外，国内开源大模型在中文上的表现要优于国外开源大模型。

而在金融领域上，通用大模型的应用表现各有差异。

AI金融竞争：百模大战如火如荼，两条技术路线各有千秋

国内互联网企业、传统金融机构及金融科技企业争相竞逐，当前竞争较为白热化。2023年5月中旬，奇富科技首先宣布推出金融行业通用大模型奇富GPT，号称“国内首个金融行业通用大模型”。2023年5月，度小满推出国内首个千亿级中文金融大模型“轩辕”。恒生电子于2023年6月发布了金融大模型LightGPT，并对其进行升级，形成“LightGPT+WarrenQ+光子”体系。2023年9月7日和9月8日，腾讯混元大模型和蚂蚁金融大模型相继正式亮相。2023年11月，幻方量化旗下DeepSeek推出DeepSeekLLM67Bt，相较于其他金融模型拥有更突出的推理、数学、编程等能力。2024年开年之初，同花顺和东方财富分别推出问财HithinkGPT和妙想金融大模型。

当前AI与金融的结合主要有两条技术路径，一是通用模型和金融语料训练融合的金融大模型，二是金融垂类大模型。那么，通用和金融融合的大模型与金融垂类大模型相比，优劣势各是什么？

由于设计和训练目的不同，通用语言大模型与金融垂类模型在优劣上具有相对性。通用语言大模型在泛用性、灵活性、数据利用率、迁移性上相比金融垂类更有优势，而在专业性、针对性、高精度和合规性上，金融垂类模型更胜一筹；在复杂度问题上，通用语言大模型在结构上更加复杂，金融垂类模型则在更新维护上具有复杂性。

图表：通用与金融垂类大模型优劣对比

两种模型相比，通用金融模型经过训练超越金融垂类模型的可能性较小。

首先，使用金融数据对通用大模型进行训练，数据欠缺，成本过高。金融领域的语料应该充分覆盖各种金融产品、市场情况和业务流程等。通用大模型缺少金融数据进行训练，金融专业知识不足；另外，如果从底层开始训练大模型，需要投入的算力成本非常高。

第四，金融领域对合规性和风险控制要求极高。金融领域对于数据保护、隐私和风险控制具有严格的要求，专门训练的金融垂类大模型可能会更好地满足这些合规性需求。

度小满CEO许东亮曾表示：“通用模型难以胜任金融领域任务，金融大模型是大模型落地金融行业的必由之路”。

国内外通用大模型在金融领域的应用表现

金融大模型始于BloombergGPT，当前国内外金融行业都在主动拥抱大模型。国际数据公司IDC的一项调研显示，超半数的金融机构计划在2023年投资生成式人工智能技术。包括BloombergGPT在内，国外已出现了一系列金融大模型。而国产金融大模型也分出了两大“流派”，一派来自于传统金融机构，另一派来自于金融系科技企业或互联网企业。

从国内外案例来看，彭博BloombergGPT率先登场，金融任务的表现远超通用模型。

2023年3月底，彭博构建了最大的特定领域数据集，并训练了专门用于金融领域的大语言模型（LLM），开发了拥有500亿参数的语言模型BloombergGPT。BloombergGPT的混合训练方法使其模型在金融任务上的表现大大超过了现有的大语言模型，而在通用场景上的表现则与之相当，甚至优于现有模型。

彭博BloombergGPT相比于通用大模型的优势在于，该模型对金融领域理解更为深刻，具有深度专业的分析能力，同时通过协助优化金融自然语言处理（NLP）任务，提升彭博终端数据的应用价值，开辟金融行业分析和决策的新可能性。

在这之后，AI4FinanceFoundation开发了FinGPT这个金融领域的语言模型。FinGPT采用以数据为中心的方法，强调了数据采集、清理和预处理在开发开源FinLLM中的关键作用。通过支持数据可访问性，FinGPT渴望加强金融领域的研究、合作和创新，为开放金融实践铺平道路。FinGPT的最后一个组成部分是应用层，旨在展示FinGPT的实际适用性。它为金融任务提供实践教程和演示应用程序，包括机器人咨询服务、量化交易和低代码开发。

国内金融垂类模型也有一些经典案例。

恒生电子的LihgtGPT金融行业大模型，是一个更专业、更合规、更轻量的模型。LightGPT拥有更专业的金融语料积累处理和更高效稳定的大模型训练方式。在金融专业问答、逻辑推理、超长文本处理能力等在内的金融大模型能力评测中均有不错表现，能保证内容和指令的合规安全，可以为多种金融业务场景提供底层AI能力支持。

其中，光子系列产品是基于LightGPT能力，致力于在合规审核、投研算法、客户服务和营销分析方面成为金融从业人员的智能助手。

WarrenQ系列产品则是一款投研效率工具产品，旨在提高研究员的工作效率和实现知识高效协同。基于大模型叠加搜索和金融数据库，通过对话指令，可轻松获得金融行情、资讯和数据，且每一句生成的对话均支持文本溯源。ChatMiner可以帮助快速提取文档中的信息，提供精准检索与定位，精炼或拓展文本。

恒生电子的LightGPT和WarrenQChat产品优势有三方面。一是金融领域生成能力强。基于2000亿中文tokens的加持，超过80个中文金融任务的打磨，可覆盖了金融绝大多数领域应用场景，针对性强，回答速度极快，准确率较高，并支持多种语言输入与输出。二是合规性、安全性高。充分学习中国的金融法律法规，在输出时符合中国金融市场的监管要求。三是轻量化。支持私有化或云部署以及灵活API调用，推理端仅需一机2卡部署。金融机构可以打造机构专属大模型，满足个性化需求。

东方财富则重磅打造妙想金融大模型，致力于满足各类金融场景需求。

妙想金融大模型，使用Decoder-only的Transformer网络结构，支持32K的上下文长度，满足各类金融场景下的需求。通过自建的数据治理和数据实验流程，结合效果预估算法、高效预训练框架、SFT、RLHF训练等技术，妙想金融大模型建立起自主研发的技术壁垒。目前，妙想金融大模型已经可以分别适配不同的应用场景，提高模型应用的效费比。

同花顺在PC端、手机端双边发力，打造多场景应用AI功能集合。

2023年12月6日，同花顺开启了问财升级版的内测，底层已经升级为HithinkGPT大语言模型，结合海量金融领域数据和知识，通过自然语言对话，协助投资者进行标的选择、标的诊断等全方位投顾服务。基于超过3000万的月活流量，以及B端产品iFind业务的快速增长，同花顺大模型有丰富的落地场景。

当前，iFinD产品实现了基于语音交互与智能搜索服务、机器阅读研报、研报知识图谱自动生成等一整套智能化解决方案，预计iFinD+大模型将结合基础功能补齐，性价比优势有望引领中期份额突破；同花顺AI开放平台目前可面向客户提供多项AI产品及服务。

投资机会：金融垂类模型百花齐放，技术领先、数据丰富的企业将持续受益

伴随着金融大模型应用的不断深化和拓展，当下金融大模型已经不局限于文本生成和虚拟客服等领域，而是开始广泛应用于金融资讯发布、产品介绍内容创作等。展望未来，随着更多的金融大模型陆续落地，将采用更加精细化处理行业细分场景，同时孕育出新的应用场景，为传统业务注入新活力，也为金融领域带来新的业务机会。这将全面提升金融服务的效能，推动金融业务生态的全面重塑，为金融行业持续的前进和革新铺平道路。

我们认为，2024年金融垂类AI大模型将迎来前所未有的蓬勃发展，形成一番百花齐放的景象。而具备AI模型技术领先优势、较大金融交易数据基础、较好应用场景入口、积极推进AI模型构建的金融科技企业将持续受益。

本文所提及的任何资讯和信息，仅为作者个人观点表达或对于具体事件的陈述，不构成推荐及投资建议，不代表本社立场。投资者应自行承担据此进行投资所产生的风险及后果。

《新财富》杂志于2001年3月创刊，专注资本市场深耕细作，“最佳分析师”“金牌董秘”“500创富榜”“最佳上市公司”“最佳投行”等权威专业评选和《德隆系》《明天帝国》《收割者》等经典研究案例影响深远。

新财富杂志社旗下主要新媒体平台包括：新财富杂志微博、新财富杂志公众号、新财富杂志视频号。

地址：深圳福田区华富街道莲花一村社区皇岗路5001号深业上城T1栋59楼

THE END

金融的大模型时代！技术路径是什么？海内外又有哪些应用？智库

全面解析：响应时间是什么意思？如何优化和测量？

挑战30宽屏极限戴尔3007WFP应用评测

等离子和led哪个好led电视与等离子电视的区别家用电器

一文扒开显示器面板/色域/刷新率等神秘参数

收集个人信息有什么用

《自动喷水灭火系统设计规范》核心考点及经典解说（一）一级消防工程师

亲，想要生病去医院不排队吗？

金融的大模型时代！技术路径是什么？海内外又有哪些应用？智库