商汤全球首发的这个功能,就连OpenAI都还没做到

原创新智元新智元2024-02-0217:01发表于北京

新智元报道

就在刚刚,商汤新一代「日日新SenseNova4.0」大模型体系全面升级,多项任务性能超越GPT-4。

与此同时,全球首个支持不同模态工具调用的AssistantsAPI,也在今日发布!

除了商量大语言模型、秒画文生图大模型外,商汤还发布了大语言模型的数据分析版本、升级了医疗版本「大医」等,将LLM通用能力推向更多领域。同时还有备受期待的多模态大模型。

值得一提的是,商汤最新的AssistantsAPI内置多种工具,支持「文生图」与「图生文」的工具属实是全球首发,目前就连OpenAI也还无法做到!

当我们将大模型和各类应用服务工具连接起来,开发者就轻松拥有了强大的AI助手,LLM「大脑」就有了「眼睛」和「手臂」。

现在,到商汤日日新SenseNova4.0平台,国内的开发者和用户就能在一个系统里,轻松调用图文多模态能力了。

全新SOTA模型+AssistantsAPI,轻松拿捏各种任务

图像理解是任何多模态模型必不可少的技能。

比如,给模型一张行车路况图,乍一看,貌似是一道考验OCR能力的题目。

实则不然,想要正确回答这道题,它不仅需要将图中占比较小的多块指示牌上的字体提取出来,还需要进行推理,最终才能判断出去黄石东路怎么走。

再输入一幅画,它便一眼认出这是油画,还可以精准地将作品中的各种细节特征描述出来,比如蝴蝶的动态、昆虫的颜色。

甚至,基于以上的一些特征总结,它还能进行深入分析,提供自身评价供我们参考。

此外,在海报识别上,它的表现也是十分出色——通过识别海报中的文字信息,便能确定海报主题。

服装穿搭,它也非常拿手,让你穿着打扮更有范儿。

当你问这件外套,该怎么搭配?

它会识别出衣服颜色款式,并会提供合适的穿搭建议,「配一件白色或浅色系的衬衫,下装选黑色或深棕色的裤子,然后配一双黑色的皮鞋」。

多模态模型能读懂的不只是氛围图,还有表情包。

比如一只倾头凝视的猫咪,以及背后传达的情绪与态度,都能识别出。

上传东方明珠的照片,它就会给出详细介绍。

除了图像理解外,文生图功能还可以为你画出刚刚这个场景的夜景。

在线检索工具,则是让我们拥有了访问外部知识的能力。

比如,让它查询上海各区最新的人口数据,就能给出准确的回应。

此外,还可以通过对话进行文档和数据分析。

比如作为一个产品经理,想了解世界范围内各个APP的使用情况,就只需要上传一份APP使用数据的excel表格。

勤勤恳恳的小浣熊会立刻在左边对话框生成相应的Python代码,以及所要求的图表,并在右边给出对应的分析结果。

不管是简单的折线图,还是复杂的箱线图,都可以快速呈现。

不仅可以针对多个表格文件进行关联分析,还能进行多轮对话。以及如果对图表呈现感觉不满意,还能提出修改意见。

商汤日日新4.0发布

显然,这些能力的实现,都要靠强大的模型能力来提供支持。

目前,经过最新升级的日日新4.0,在整体表现上已经非常接近GPT-4的水平了。

相比之前版本,日日新4.0拥有更为全面的知识覆盖、更加可靠的推理能力,更长文本理解力,及稳定的数字推理能力和代码生成能力,并支持跨模态交互。

具体来说:

-而推理能力则达到了GPT-4Turbo99%的水平

我们看到,研究团队新增了包括业务通用、数学能力、K12考试和文学期刊数据的约600Btokens的中英文预训练语料,从而让模型的理解能力和输出质量有了质的提高。

此外还对模型进行了4次超强的预训练,使得模型在阅读理解、综合推理、代码能力等任务上实现了5%-10%的定向性提升。

针对不同的使用场景,他们分别升级了4k、32k、128k三种上下文窗口模型的性能,拓展了应用范围。

其中SenseChat-32k可支持约三万字以上的中文长文本总结,整体能力平均达到了GPT-4-32K90%以上水平,并在理解能力上实现了超越。

而「旗舰级」的SenseChat-128k,更是可以支持约十二万以上的中文长文本总结,并且同样在理解能力方面实现了对GPT-4的超越。

在「大海捞针」实验中128k、32k都实现了近乎完美的召回率,整体表现超过GPT-4。

日日新·商量大语言模型-数据分析版本(SenseChat-DataAnalysisCodeV4)

除此之外,商汤还新增了商量大语言模型-数据分析版本以及数据分析工具「办公小浣熊」,能理解多种表格和文件类型以及复杂表格处理。

可支持多种格式的本地数据文件上传(如xls、xlsx、csv、txt、json等),以及单表格、多表格、多文档类型、复杂表格等不同数据场景。

结果显示,模型在1000+测试集上的精度超越GPT-4(85.71%vs84.62%),并且在强大的中文理解能力加持下,更能够满足国内数据分析的需求。

日日新·商量大语言模型-医疗版本「大医」(SenseChat-MedicalV4)

医疗场景下,「大医」在多轮对话与上下文理解能力上面实现了性能的大幅提升。

它还可以有效实现专业医学问答以及复杂医学任务的推理,配合上丰富的工具调用能力,还能支持更多模态医学文件的智能解读和交互问答。

在两项行业权威评测——2023年职业药剂师考试大模型评测和中文医疗大语言模型开放评测平台MedBench中,「大医」均跻身综合评分排名第二,性能接近GPT-4。

成绩超越了多个通用及医疗垂类开源大语言模型,体现了非常高的专业垂直领域的落地性能。

2023年职业药剂师考试大模型评测

中文医疗大语言模型的开放评测平台MedBench

AssistantsAPI首次支持不同模态工具调用

-持久对话,意味着开发者不用再为如何处理长历史会话而烦恼

-支持对检索(Retrieval)、代码解释器(CodeInterpreter)等OpenAI托管工具的访问

THE END
1.百度识图在线入口百度识图可以识别商品、素材、植物、人物、风景等图片,用户只需上传图片可搜到类似内容,具体的入口地址可能很多小伙伴还不清楚,下面小编将为大家详细介绍一下,感兴趣的一起来看看吧。 百度识图在线入口 入口地址:点击前往 详细介绍 1、用户只需点击上述链接就能直接跳转至百度识图界面。 https://app.ali213.net/gl/1572613.html
2.智能识图在线使用在线协同编辑华为云帮助中心为你分享云计算行业信息,包含产品介绍、用户指南、开发指南、最佳实践和常见问题等文档,方便快速查找定位问题与能力成长,并提供相关资料和解决方案。本页面关键词:智能识图在线使用。https://support.huaweicloud.com/topic/655003-4-Z
3.百度智能识图在线使用理想股票技术论坛想要在线使用百度智能识图,可按照以下方法操作:首先前往百度官网,然后点击进入智能识图功能页面。接着上传待识别的图片,系统将自动进行图像识别,并提供相关搜索结果和信息。了解百度智能识图的详细使用教程及步骤,让您更好地应用这一功能。 ,理想股票技术论坛https://www.55188.com/tag-03997885.html
4.百度识图APP官方版:一款智能识图在线使用百度搜索的手机软件百度识图APP官方版是一款智能识别图片内容在意文字形式在线搜索的手机软件。在这里通过在线拍摄自己想要的图片在进行软件内部的自动识别,更具画面的内容信息自动转成相对准确文字信息进行一个全平台的火速搜索,保证让你看到一个相同图片内容不同画风的各种美轮美奂的图片~https://www.msdn.hk/news/943.html
5.图像识别边缘智能服务平台 EISP 边缘智能云 EIC 消息队列 RocketMQ 消息队列 MQTT 消息队列 RabbitMQ 云空间 区块链服务平台 视频点播 视频直播 号码认证 移动推送 实人认证 智能语音交互 文字识别OCR 人脸识别与人体识别 图像识别 接口概述 使用说明 OpenAPI文档 https://ecloud.10086.cn/op-help-center/api/outline/77270
6.搜狗在线智能识图工具搜狗在线智能识图工具是一款功能强大的图片搜索识别应用。它能够帮助用户快速识别图片中的内容,包括但不限于人物、地点、物品等,并能在互联网上找到与之相关的信息。该工具的主要特点和使用方法如下: 1. **功能特点**: - **人物识别**:可以识别图片中的人物,并提供相关信息。 https://www.360doc.cn/article/81723323_1118763810.html
7.在线智能识图您好!很高兴为您解答哦!~[心][鲜花][开心][大红花]亲,在线智能识图的主要功能:24小时在线客服系统,语,轻松生成7种语言的用户语料。极致的体验:全场景覆盖。已经为用户提供了丰富多彩的在线语料库,如我们在“蘑菇街”上的“阳光厨房”,为用户提供了优质的在线语料供用户选择,提升了用户的使https://wen.baidu.com/question/1741918311973675307.html
8.在精不在多,推荐5个优秀的AI人工智能工具导航网站简介:专业的全能型AI内容创作网站,万彩AI包括 AI 智能写作、AI 视频创作、AI 数字人,满足用户对于AI创作的多种需求。 访问地址: 万彩http://Aai.kezhan365.com/ 3、Futurepedia 简介:Futurepedia为用户提供了一个方便快捷的方式,来发现和使用各种人工智能工具。Futurepedia收录了700多个人工智能工具,涵盖了40多个https://zhuanlan.zhihu.com/p/697072913
9.人工智能基础第3章别具慧眼:识图人物在线免费阅读看人工智能基础第3章 别具慧眼:识图人物最新章节, 对于图片分类这个任务,我们应该使用什么样的流番茄小说网下载番茄小说免费阅读全文。https://fanqienovel.com/reader/7109739702881618978
10.微软ai识图使用方法?一、微软ai识图使用方法? 识别图片中的文字,你可以选择直接复制文字分享给微信好友、保存为Word文档在PC上编辑,还可以直接修改和翻译识别文字。 直接把图片生成为PDF和PPT文档,方便通过邮件分享。使用智能裁剪功能选取图片关键区域,让文档看起来更专业。 识别图片中的表格,无论表格里文字还是表格的框线都能识别出来,你https://tool.a5.cn/article/show/77712.html
11.骁龙710锻造全面屏轻旗舰(全文)vivoNEX手机评测值得注意的是,在机身左侧独立放置了Jovi AI按键,长按能够对Jovi AI助手进行唤醒,短按能够实现对屏幕的智能识别,在日常使用中,实用性相当不错。机身右侧则是音量按键与电源键,对于我这种小手用户来说,整体按键使用都很舒适,看来vivo为了用户体验对按键也是经过了反复打磨。 https://mobile.zol.com.cn/693/6931714_all.html
12.拍照识图智能慧眼识别图片【产品简介】 这是一款人工智能识图软件,基于深度学习及大规模图像训练,支持类别多,识别速度快,结果准确。 【特色功能】 1、动物识别:检测用户拍摄的动物图片,返回动物名称、置信度等信息。 2、菜品识别:检测用户拍摄的菜品图片,返回具体的菜名、卡路里、置信https://apps.apple.com/us/app/id1210590806?l=zh&see-all=customers-also-bought-apps
13.ios18.2拍照识图怎么开启我们用一台港版 iPhone,先睹为快苹果智能 这两天,苹果正式推送了 iOS 18.2 Beta 版,许多发布会上的演示功能,终于能在手机上使用了。 智能识图、翻译外语、识别网站地址,只要 iPhone 能看到的,它就大概率能给你个正确的答案,当然也有翻车时候,而且新系统还有一点点小遗憾,快来看看。#数码科技 #iphone #ios18https://www.douyin.com/topic/7446530807952574491
14.如何用ai以图搜图:ai查图3、爱奇艺如何以图搜剧?爱奇艺以图搜剧使用教程 4、如何用ai进行换脸 5、人脸图像识别软件有哪些 6、ai绘画生成器是图片搜索么? wordpress强大的以图搜图系统Imgso插件,智能识图功能让你的素材网站更 以图搜图都是需要服务器识别计算的,一般的网站都是没有办法实现的。 https://www.freshc.cn/a/195941.html
15.织梦tag标签怎么用织梦字母搜索插件5、如何使用Dreamweaverxml地图生成插件?方法/步骤 在修改背景之前 虽然织梦后台也有自动生成地图的功能,但只是生成栏目目录的功能,并不能实现我们想要的Sitemap地图。 wordpress强大的以图搜图系统Imgso插件,智能识图功能让你的素材网站更… 1、以图搜图都是需要服务器识别计算的,一般的网站都是没有办法实现的。 https://www.kdun.com/ask/52587.html
16.搜图神器官方网站搜图神器官方网站|网页版|PC电脑版下载|APP客户端下载,聚合海内外知名图片搜索引擎,以图搜图引擎,一键搜索所有图片资源免费下载!更有海量丰富图库素材资源免费获取,主打二次元、插画、唯美、风景、美女壁纸,分类明细,主题齐全!满足你日常生活学习所有的用图需求!让http://www.soutushenqi.com/recognizePicture