大模型赛道:风浪越大“鱼”越贵

简单跟进下近期大模型领域的投融资,可以说是“喜报”频传。

致力于对话机器人行业解决方案的竹间智能完成超亿元D+轮融资;致力于企业创新数智化平台的衔远科技完成数亿元天使轮融资;医疗交互AI平台聆心智能完成Pre-A轮融资;二月底,Tiamat完成近千万美元A轮融资,DCM和绿洲资本联合领投。

二级市场撒网摸鱼者有之,声浪喧嚣者有之,但一级市场却罕见地保持了观望态度。

但现在我们知道,大模型这场比赛,不管入局者有没有准备好,枪已经响了。

枪响了

3月16日的发布会上,李彦宏表示,已经有超过650家企业接入文心一言。

虽然在产品展示时使用预录制Demo,被戏称为“发布会跟我答辩一样,生怕说多了露馅”,但根据百度提供的数据,发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家。到了3月17日,这个数字达到了7.5万,与百度智能云基于文心一言展开合作咨询的信息也已达到了6080条。

这意味着即便相对于GPT-4来说还有许多不足,但是大家都对于大模型倾注了热情,而另一方面也是的确不敢掉队。

之前,前美团联合创始人王慧文朋友圈发布“人工智能宣言”,宣布自己出资5000万美元投身人工智能领域,寻找“业界顶级”、“狂热爱好AI”的技术人才,打造中国版OpenAI。王慧文还称,下轮融资已经有顶级VC认购2.3亿美金。

据多方了解,王慧文口中的“顶级VC”至少包括源码资本、真格基金等。有消息称,源码资本已准备出资1亿美元,源码资本创始合伙人曹毅也在朋友圈表示:“祝贺老王等到了,行业也等到了老王出山”。

而后,昔日并肩多年的好友王兴也决定加入,将以个人身份参与王慧文创业公司“光年之外”的A轮投资,并出任董事。他在朋友圈中表示,“AI大模型让我既兴奋于即将创造出来的巨大生产力,又忧虑它未来对整个世界的冲击。老王和我在创业路上同行近二十年,既然他决心拥抱这次大浪潮,那我必须支持。”

技术的迭代如此之快,以至于任何一个公司都不敢小觑AI的能力,这反映到提供预训练模型的巨头基础层公司和广阔的应用层公司是如此,转向中间层开发垂直化、个性化模型的中小型企业,仍然如此。

从事AI大模型研发的澜舟科技成立于2021年6月,是一家由李开复的创新工场孵化、从事AI大模型研发的认知智能公司。2021年7月,其孟子大模型在中文语言理解评测CLUE榜单上登顶第一,刷新业界记录,用10亿参数级别的轻量化模型击败其他巨头公司百亿甚至千亿参数级别的模型。

接着的半年内,公司就拿到了三轮融资,前两轮由由创新工场人工智能工程院和前沿科技基金主导,第三轮Pre-A轮融资金额达到了数亿人民币,由联想创投、斯道资本共同领投。而今年这轮融资,斯道资本也选择了继续加注。

二月底,AI图像生成技术服务商Tiamat完成近千万美元A轮融资。而前京东AI掌门人周伯文带队的衔远科技也在近日揽获了亿元天使轮投资。

大模型的风,算是越吹越大了。

大算力是入场券吗?

当然,就像观望的投资人所考虑的那样,风浪再大的赛道,拿到入场券的也只会是少数。而什么能够拓展未来的想象空间,或许我们能从这几个企业中窥得一斑。

有人直观地表示:大数据+大算力+强算法=大模型。确实是大力出奇迹的暴力美学典范。

在GPT-4公布前,不少人判断GPT-4将是百万亿大模型(之前GPT-3.5是1750亿模型)。

但是Altman也亲自下场辟谣,表示GPT-4的参数量不会大很多,但可能会用到更多的计算资源。

技术迭代下追求模型参数和算力的无限大并不是唯一的道路,不管是孟子通用预训练大模型还是Tiamat的MorpherVLM,都在十亿、百亿级别,但是在纵深场景上已经有了一定的优势。

衔远科技创始人周伯文对甲子光年表达过这样的认知:“我并不认为要做到GPT-3的效果,一定需要1750亿模型参数。事实上我们有大量的空间去压缩它。这是我对技术的判断。因为如果我们不做GPT-3这种‘万金油’式的生成式AI,那么我们就可以把它的认知领域缩小到更窄的范围,但同时深度大大加深。”

巨头内卷预训练模型,做基础生态,中间层和应用层的广阔空间则更加open,以上这几个企业也暗合了这个逻辑,切入点均有不同。衔远科技利用生成式AI能力将市场、消费者与趋势洞察直接生成为产品的创意与品参,致力于加速企业产品到市场的速度、提升爆款概率。聆心智能把重点放在了医疗领域,Tiamat则专注于AI图像生成。

和垂直行业绑定,做深入而具体的工作,或许更容易跑出一条可行之路。

再看看这几家公司的掌门人,基本都是履历“金光闪闪”的大牛。

澜舟科技创始人周明,1991年就从NLP重镇哈工大拿到了博士学位,其后进入清华任职任教,并在1999年被微软亚洲研究院创始院长李开复挖走,后来不久成为NLP研究组负责人。直到2020年离开,周明已经是微软亚洲研究院副院长多年。

辞职后,孟子通用预训练模型开始孵化,于2021年4月正式推出。

2021年6月,10亿参数的孟子轻量化预训练模型在CLUE(中文语言理解测评基准)的任务比赛中获得第一。2022年8月,孟子预训练模型获得ZeroCLUE(Zero-ShotLearning,零样本学习)和FewCLUE(小样本学习)榜单第一。而后的一系列投资,也验证了技术硬实力加持下,有足够的想象空间。

再数一数,衔远科技创始人周伯文曾是京东AI掌门人,他2016年提出的“自注意力融合多头机制的自然语言表征机理”,是Transformer架构的核心思想之一。竹间智能的简仁贤出身微软,曾是微软(亚洲)互联网工程院副院长,在职期间带领过微软小冰、小娜等聊天机器人项目。而聆心智能孵化自清华大学计算机系,履历皆是不俗。

反看前两年AIGC赛道拿到融资的企业,还集中在依靠接口或者开源模型的应用层公司,技术门槛不高,一级市场没那么容易买单。即使2022年下半年AI绘画火出了圈,也不过是一根燃烧几秒就难以为继的火柴。

而今年,ChatGPT则告诉我们,拾薪构火,想燃得大,得技术者得之,绑定深度场景者得之。

就像2015年阿尔法狗大火,有记者提问,百度什么时候能做出一个阿尔法狗这样性感的事情

奇点已至,现在我们或许可以期待更多“性感”的企业跑出来。

THE END
1.大数据和云计算:它们如何融合及其优势数字经济观察网大数据与云计算的融合代表着企业信息管理和数据使用方式的一场革命。这种技术的结合不仅降低了企业的IT成本,还提升了灵活性、可扩展性和决策效率。随着这两项技术的不断发展,企业在未来将能够以更低的成本、更高的速度和更强的安全性来管理、存储和分析海量数据,从而推动数字化转型,增强市场竞争力。 https://www.szw.org.cn/20241219/68496.html
2.计算机行业点评:推理算力需求创新高叠加制裁可能加剧看好国产算力1、豆包活跃度数据迅速上升,或推动字节推理算力需求进一步增长根据量子位公众号及快科技数据,2024 年11 月份豆包APP DAU 接近900万,占据国内整个赛道60%的活跃用户,11 月份MAU 数据达5998 万,位居全球第二,仅次于ChatGPT。此外,截至今年12 月18 日,豆包大模型的日均 tokens 调用量超过4 万亿,自5 月发布以来,https://stock.finance.sina.com.cn/stock/go.php/vReport_Show/kind/search/rptid/787889446679/index.phtml
3.算力迈向多元融合随着新一轮科技革命和产业变革深入发展,人工智能已成为驱动新质生产力的重要引擎,算力需求激增。加强算力网络建设有助于实现以网强算,推进我国从算力大国迈向算力强国。 我国算力、算网规模及能力持续攀升。工业和信息化部数据显示,截至今年6月,我国在用算力中心机架总规模超830万标准机架,算力总规模达246EFLOPS(每秒http://sjj.sjz.gov.cn/columns/7e4f8d1b-faa1-4fec-8555-72e1dcc1c1f3/202412/16/0b1d0cad-bf45-4f60-a808-e3ae4a22a097.html
4.AI大模型:大数据+大算力+强算法大模型算力算法数据AI大模型:大数据+大算力+强算法 前言:好久不见,甚是想念,我是辣条,我又回来啦,兄弟们,一别两年,还有多少老哥们在呢? 目录 一年半没更文我干啥去了? AI大模型火了 人工智能 大模型的理解 为什么学习大模型 大模型Function Calling功能增强 大模型接入公司的数据:embeddings&RAGhttps://blog.csdn.net/m0_65555479/article/details/139085917
5.原创如何释放大模型对金融行业的价值?新闻频道大模型=大算力+大数据+强算法 今年以来ChatGPT风头强劲,带火了大模型技术。大模型即网络参数规模达到亿级以上的“预训练深度学习算法”,在文本图像理解、内容生成等任务表现出显著优势和巨大潜力。 “大模型必须基于‘大算力+大数据+大算法参数网络结构’进行训练。”吕仲涛介绍,大模型技术是一个复杂的体系性工程,涵盖https://news.hexun.com/2023-06-14/208961897.html
6.“移”起AI+丨“人工智能+”行动,中国移动怎么干?大平台派上“大用场” 模型不是直接“跑”在算力上,还需要平台来连接算力和应用,需要通过各种各样的平台工具,实现基础模型、行业模型到应用的跨越。中国移动自主研发的“九天”人工智能平台,就是面向个人及行业客户提供从算力、数据、算法框架到研发工具的全栈AI服务,并面向通用智能及大小模型训推场景,实现全面升级。https://www1.10086.cn/aboutus/news/groupnews/index_detail_49938.html
7.开源竞速:AI大模型的“Linux时刻”降临2、中长期来看,如果部分开源大模型能力被进一步验证,则应用将快速铺开,大模型对算力将形成正循环; 3、其他:边缘算力、大数据公司和开源大模型服务商业态也值得关注。建议关注: 1)光模块服务商:中际旭创、新易盛、天孚通信、源杰科技; 2)智能模组服务商:美格智能、广和通; https://www.pingwest.com/a/283188
8.算力+算法+算元描绘数字化改革转型之路南方电网广西电网公司依托“算力+算法+算元”,守牢网络安全底线,积极挖掘数据要素价值,稳步推进数字化转型和数字电网建设。 南方电网广西电网公司积极推出“科技强安”,研发投运了21套人工智能应用,进一步提升网络及信息系统安全运行稳定性。 【广告】 近期,在鲲鹏应用创新大赛2022全国总决赛中,南方电网广西电网公司“基于https://m.yunnan.cn/system/2022/11/23/032363036.shtml
9.地平线L4级AI芯片单挑英伟达,3岁壁仞创全球算力纪录,国产芯开挂了何为大模型?通俗讲,就是“大数据+大算力+强算法”的结合产物,是实现人工智能应用的载体。 如鹏城—百度·文心大模型,是去年底百度发布的全球最大的中文单体模型,并已大规模应用于百度搜索、信息流、智能音箱等产品。在金融领域,该模型能完成一份合同内近40个类目条款的智能分类,将处理单份合同文本的时长缩短至1https://www.jfdaily.com/wx/detail.do?id=523435
10.10倍GPT参数量越大不代表模型性能一定越好。在悟道2.0中,40亿参数的多模态预训练模型CogView,在MS COCO数据集上比拥有130亿参数的DALL·E表现更好。因此,在大数据和算力的支持下,算法的性能更为重要。谷歌发布的Switch Transformer,虽然达到了万亿级规模,但其下游任务的精度并没有大幅度提升。 https://picture.iczhiku.com/weixin/message1622608239754.html
11.背景AI大模型和算力标的!财富号评论(cfhpl)股吧AI浪潮滚滚而来,而大模型则是AI时代的基础设施,也是大国角力的新战场。近期华为概念把大模型、大数据、大算力、人工智能的风又刮了起来,但浙大网新却还是趴在底部,究其原因,是网新似乎和华为不沾边。但是从AI大模型的生态角度来分析,浙大网新是妥妥的兼具“学院派”与“大厂派”背景,与微软生态有紧密合作,同时http://gubaf10.eastmoney.com/news,cfhpl,1354756619,d.html
12.中国移动:建成近50万5G基站,大力推动5G+AI规模化应用移动通信网络基于大数据、大算力、大算法三大基础能力,可从以人驱动为主的人治模式变为网络自我驱动的自治模式,实现网络自适应、行为自学习和功能自演进等功能。“(AI)在基站节能、动态频谱分配等领域都有很好的案例。网络运维效率、信息业务的使能和安全防护能力提升方面都取得了一些进步。“https://www.yicai.com/news/101106833.html
13.揭秘大模型背后的神秘力量:算力数据与算法的“黄金三角在人工智能的浩瀚星空中,大模型犹如一颗璀璨的新星,引领着技术的前沿。但你是否好奇,是什么让这颗新星如此耀眼?今天,就让我们一起揭开大模型背后的神秘面纱,探索那支撑其辉煌成就的“黄金三角”——算力、数据与高性能算法。 一、算力:大模型的超级引擎 https://cloud.tencent.com/developer/article/2453952
14.以算力算法强大大数据应用以创新生态壮大大数据产业6月10日,省委书记楼阳生在山西同方知网公司调研,了解大数据平台建设和应用情况。山西日报记者李联军摄 山西晚报讯(山西日报记者 陈俊琦)6月10日,省委书记楼阳生在太原市调研大数据产业发展并主持召开座谈会。他强调,要认真学习贯彻习近平总书记视察山西重要讲话重要指示精神和关于实施国家大数据战略的重要论述,以算力算法强大http://epaper.sxrb.com/wap/sxwb/20200611/506453.shtml
15.美国最新芯片管制对国内供应链的影响华强资讯AI的发展离不开大算力、强算法、大数据三大要素。其中,大算力相当于人工智能的土壤,没有大算力的支持,就不会有AI的成功。 美国的“如意算盘”:卡住AI芯片的“脖子” 为了限制中国人工智能等高科技产业的发展,早在2022年10月7日,美国政府就规定算力上限为4800(INT8 超过 600TOPS 或 FP16 超过 300TFLOPS)以及带https://news.hqew.com/info-371137