端侧多模态“小模型”IvyVL,性能逆袭大模型!耗能低适配强,欢迎体验vl

始智AIwisemodel.cn社区是源自中国的中立开放的AI开源社区。正在,欢迎加入共同成长。wisemodel社区上线,H800/H20等资源上线,价格实惠,灵活方便,支持在线微调训练模型,及和,并。

在人工智能飞速发展的浪潮中,多模态大模型(MLLMs)在计算机视觉、自然语言处理和多模态任务里起着关键作用。只是,移动设备和边缘设备硬件资源有限,能效要求又高,要把这些模型成功部署上去,长期以来都是棘手难题。

在这一背景下,轻量级多模态模型Ivy-VL成为面向移动端多模态模型的新代表。它解决了多模态大模型在端侧部署时面临的硬件资源受限、能效不足及难以满足多模态任务需求等问题。

该模型由AISafeguard联合卡内基梅隆大学、斯坦福大学开发,它的出现既推动了移动端AI应用的发展,也为更多设备在低功耗环境下运行先进AI技术提供了基础。Ivy-VL模型已上线始智AI-wisemodel开源社区,欢迎前去体验。

模型地址

01.

模型亮点

1.极致轻量化

Ivy-VL的参数量仅为3B,极大地降低了计算资源需求,与7B以几十B的多模态模型相比,具有更小的硬件占用。模型可高效运行于AI眼镜、智能手机等资源受限的设备上。

2.卓越性能

Ivy-VL在多个多模态榜单中夺得SOTA(state-of-the-art)成绩。通过精优化的数据集训练,Ivy[1]VL展现了远超同类模型的性能,证明了小模型同样可以实现突破。

在专业多模态模型评测榜单OpenCompass上,做到4B以下开源模型第的性能。超越了顶尖的端侧SOTA模型,包括Qwen2-VL-2B、InternVL2-2B、InternVL2.5-2B、SmolVLM-Instruct、Aquila-VL-2B以及PaliGemma3B等模型。

3.低延迟和高响应速度

3B的LLM模型大小,显著提升了Ivy-VL的响应速度,确保其在端侧设备上实现实时推理。在生成速度、能效比和准确率之间,达到了完美平衡。

4.强大的跨模态理解能力

Ivy-VL基于LLaVA-One-Vision,结合先进的视觉编码器(google/siglip-so400m-patch14-384)与强大的语言模型(Qwen2.5-3B-Instruct),Ivy-VL在视觉问答、图像描述、复杂推理等任务中表现优异,完美满足端侧应用的多模态需求。

5.开放生态

Ivy-VL将模型开源,并且允许商用,方便开发者快速上手。无论是AI创新团队还是个人开发者,都可以利用Ivy-VL构建自己的多模态应用。

02.

核心应用场景

Ivy-VL为多模态大模型的边缘部署和普及开创了全新可能。无论是推动移动设备AI应用,还是服务于广泛的IoT设备,Ivy-VL都在积极赋能各个领域。

智能穿戴设备:支持AI眼镜实现实时视觉问答,辅助增强现实(AR)体验。

手机端智能助手:提供更智能的多模态交互能力,让手机用户体验更自然的AI服务。

物联网设备:助力智能家居和IoT场景实现更高效的多模态数据处理。

移动端教育与娱乐:在教育软件中增强图像理解与交互能力,推动移动学习与沉浸式娱乐体验。

03.

测试用例

Ivy-VL在科学自然问题中获得了很好的性能,可以发现在第一张图中,Ivy-VL能准确识别是哪个生物体的生命周期,第二张图中判断图中哪个阶段代表冬至。

在推理和图表问题中,可以看出,在第一张图中,Ivy-VL可以准确的识别出图中量杯的总容积是多少。第二张图中,需要进行的推理问题,模型同样给出正确的答案。

Ivy-VL标志着轻量级多模态模型在端侧设备上的一次重要突破。未来,研究团队将持续优化模型,进一步提升其在视频模态任务中的表现,并探索更多行业应用场景。

编辑丨赵雅鑫

-----END-----

系统升级:

系列模型:

关于wisemodel更多

1

2

欢迎加盟wisemodel开源社区

3

欢迎投稿优质内容

4

关于wisemodel开源社区

始智AIwisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。

THE END
1.智能优化,自适应助力企业构建高效在线平台网站建设在启动自适应之前,企业需明确网站的定位,包括目标受众、行业特性、业务领域等,这一步有助于确立网站的风格、功能以及内容布局。 2. 选择适配技术 目前,市面上常见的自适应技术包括Bootstrap、响应式布局等,企业应根据自身需求挑选最合适的技术,Bootstrap是一款广泛使用的开源前端框架,拥有丰富的组件和样式,能够助力快速http://www.fengzhengtop.com/wzjs/415709.html
2.大众科普关于放疗“憋尿”的Q&A和“在线自适应放疗技术”由于“在线自适应技术”产生的新治疗计划,其基础是患者当时的CBCT影像,因此患者不需要进行“憋尿”也可以直观的实现既保护正常器官组织,又对病灶进行的精确打击,治疗的体验和舒适度也大大提高了。 Q:“听起来这么多‘高科技’不至于就只解决了一个‘憋尿’问题吧?” https://www.jsz120.com/helpd_6741.html
3.在线自适应放疗技术,精准快速打击肿瘤中国人民解放军总医院磁共振引导在线自适应放疗技术 实施为期5天的短程方案 方案实施后 刘大爷顺利完成保肛手术 令人欣喜的是 术后病理已经看不到肿瘤细胞 肿瘤病灶完全消失 达到完全缓解 在刘大爷的放疗过程中,通过治疗前扫描的磁共振图像可以看到,膀胱的形状跟定位时相比发生了较大变化,挤压影响到肠道的位置和照射靶区的形状,如果还按https://www.301hospital.com.cn/want/news/Medical/detaol/11842.html
4.技术前沿基于机器学习的供水管网水力模型在线自适应校核技术针对目前供水管网水力模型校核精度低、实时自适应差的关键瓶颈问题,本文介绍了一种基于传统的供水管网机理模型与管网监测大数据融合,人工智能算法为核心的供水管网水力模型在线校核技术体系,实现供水管网水力模型实时在线校核与运行异常状态诊断。以提高管网模型校核精度、实时性、异常运行状态自适应性等为主要目标,围绕着影响https://enviro-lib.tongji.edu.cn/info/1018/1430.htm
5.新技术!自适应性放疗比传统放疗更准更快这种放疗技术一经出现,引起了业内专家的高度关注和极大热情。 自适应放疗改变了放疗科岗位职责 “在线自适应放疗流程的核心词——快、自动”,邱杰解释道。 虽然自适应放疗设备可以利用人工智能自动勾画靶区和危及器官的轮廓,可以节约时间成本,但医生必须审查和手动修改调整人工智能生成的结构轮廓。王洋表示,这需要通过临http://health.ycwb.com/2023-10/22/content_52278848.htm
6.自适应在线学习技术实现的概率负荷预测算法(含代码实现),自适应在线基于自适应在线学习的概率负荷预测(代码) ID:97100732937762675 c小路2580 在软件开发领域,概率负荷预测是一项关键性的技术,它对于确保系统的稳定性和性能优化具有重要意义。随着云计算和大数据技术的快速发展,越来越多的企业和组织开始关注如何准确预测系统的负荷情况,以便有效规划资源和提供更好的用户体验。 https://blog.csdn.net/GehJnxoJxW/article/details/139521320
7.自适应放疗(adaptiveradiationtherapy,ART)EthosEthos电子直线加速器是基于人工智能技术的在线自适应放疗系统,是在常规加速器的基础上,通过人工智能、多模态高清影像、高效快速的图像引导和在线质控系统等尖端技术去实现在线自适应放疗的治疗平台。采用驻波加速管,产生无均整模式(FFF)的6 MV射线,最高剂量率800 MU/min。 https://m.haodf.com/neirong/wenzhang/9393297289.html
8.在线自适应深度视觉里程计wx5d23599e462fa的技术博客CVPR2021:推广到开放世界的在线自适应深度视觉里程计 【摘要】 近些年,基于学习的视觉里程计已经展现出了较为可观的结果,但预训练网络在未知环境中很容易失效。在这篇论文中,提出一个用于深度VO的在线自适应网络(借助场景不可知的几何计算和贝叶斯推理的辅助)。与基于学习的位姿估计不同,论文的苏阿女法从深度和光流中https://blog.51cto.com/u_14439393/5524637
9.2022年度陕西省重点研发计划项目申报指南目录5.1 空地一体化网络立体致密多维覆盖技术 5.2 面向天地一体化大规模星座的网络化测控关键技术 5.3 新型天线形态下基于大规模 MIMO 的机载数据高速传输技术 5.4 基于区块链架构的异构无线网络资源共享技术 5.5 面向智能网络管控的知识表征与推理技术 5.6 面向动态用户的自适应波束资源管控技术 http://www.kt180.com/html/sxs/9889.html
10.真人在线免费解题为何变成了“香饽饽”?虽然国外自适应学习技术已经比较成熟,但国内相关公司在自适应的技术上仍处于萌芽阶段。以拍照搜题为例,产品大多只能提供简单的错题本功能,个别产品虽然应用了一些相对更为复杂的逻辑,但却不能提供真正意义上的教学。因而不适合学习新的知识点,尤其是理解起来相对困难的知识点。 https://m.thepaper.cn/wap/resource/jsp/newsDetail_forward_10330297
11.驰声听说在线自适应学习平台重要须知:驰声听说在线一贯重视用户(或称“您”)的个人信息的保护,在向您提供驰声听说在线应用产品与/或您使用驰声听说在线的服务的时候,驰声听说在线有可能会收集和使用您的个人信息。为此,驰声听说在线服务提供者(或称“我们”)通过本《隐私政策》(以下称“本政策”)向您说明,驰声听说在线是如何收集、使用、共享、https://www.91tszx.com/static/page/private.html
12.长者专区主要完成单位:国家管网集团联合管道有限责任公司西气东输分公司银川管理处、北京石油化工学院、国家石油天然气管网集团有限公司西气东输分公司、国家石油天然气管网集团有限公司科学技术研究总院分公司、中国石油大学(北京) 九、回采巷道自适应超前支护关键技术与装备研发应用 https://kjj.yinchuan.gov.cn/zzb/tzgg_72156/202401/t20240118_4421429.html
13.2013年度山东势学技术奖建议授奖人选和项目公示山东新闻42.山东电网新能源调度技术支持系统研发与应用 完成单位:山东电力调度控制中心 完成人:刘红军,张强,张国强,马琳琳,尚力,韩德顺,陈玉名,韩少晓,张健 43.自适应、自校正、感知化的智能调度计划技术支持系统 完成单位:山东电力调度控制中心 清华大学 北京清大科越科技有限公司 https://www.dzwww.com/shandong/sdnews/201311/t20131118_9199648_3.htm
14.复旦肿瘤疫情期间完成首例在线自适应「云」放疗其次,通过「云端」信息化技术,实现在线自适应计划修改以及治疗实施,让医生、物理师「分室操作」,与患者全程零接触。 复旦大学附属肿瘤医院放射治疗中心主任章真教授针对疫情下的放疗模式提出:“打造疫情下的uCT-ART精准在线自适应放疗,是联影与复旦肿瘤对重大卫生公共事件的快速响应,与患者关爱的共识。这套系统的开发对https://www.united-imaging.com/zh-cn/news-center/uih-news-list/2022-05-26