机器能模拟人类感受?明略科技多模态团队斩获ACMMM全球顶会“最佳论文提名”

10月28日~11月1日,全球顶级多媒体会议ACMMultimedia(ACMMM)2024在澳大利亚墨尔本成功召开。

明略科技集团多模态团队与北京大学共同完成的最新研究成果《HypergraphMulti-modalLargeLanguageModel:ExploitingEEGandEye-trackingModalitiestoEvaluateHeterogeneousResponsesforVideoUnderstanding》在众多论文中脱颖而出,荣获最佳论文提名(Bestpapernomination)。明略科技集团创始人、董事长兼CEO吴明辉,多模态大模型部门负责人赵晨旭,明敬算法负责人苏安炀受邀赴墨尔本出席此次会议。

据悉,本次会议共收到4385篇有效投稿,其中,1149篇论文被接收,174篇论文被评选为Oral,最终仅26篇获得最佳论文提名。

明略科技集团创始人、董事长、CEO兼CTO吴明辉

在ACMMMOralSession讲解最新研究成果

明略科技集团多模态团队在ACMMM2024会议现场

(左起:苏安炀、吴明辉、赵晨旭)

ACMMM会议是由国际计算机学会(ACM)主办的多媒体领域的顶级国际学术会议,同时也是中国计算机学会推荐的A类国际学术会议(CCF-A)。自1993年举办以来,今年是第32届。会议议题涵盖多媒体计算的各个方面,如多媒体内容分析、多媒体检索、多媒体安全、人机交互、计算机视觉等。

ACMMM2024会议现场公布最佳论文提名奖项

针对当前AI领域在视频内容理解方面主要聚焦于客观层面,缺少主观层面的测量标准,以及机器模拟人类主观感受的有效手段的发展情况,明略科技的最新研究成果整合脑电、眼动信号等多种非标模态,构建了全新的多模态大语言模型范式,在机器理解和模拟人类主观感受的研究方向,迈出了重要一步。

明略科技多模态团队论文荣获ACMMM2024最佳论文提名奖项

论文题目:HypergraphMulti-modalLargeLanguageModel:ExploitingEEGandEye-trackingModalitiestoEvaluateHeterogeneousResponsesforVideoUnderstanding

(超图多模态大语言模型:应用脑电和眼动模态来评估异质人群观看视频时的响应)

作者:吴明辉*,赵晨旭*,苏安炀*,狄东林,傅天宇,安达,何敏,高雅,马萌,颜鲲,王平(*为共同第一作者)

2)视频中的内容和场景过于单调,仅涉及到对视频内容的客观描述。

为了弥合与实际应用的差距,明略科技引入大规模的视频主观多模态评估数据集Video-SME。通过收集不同人群在观看相同视频内容时脑电图(EEG)和眼动追踪区域的真实变化,设立了新的任务和协议,分析和评估不同受试者对相同视频内容的认知理解程度。

依托新的评测标准,明略科技创新研发了超图多模态大语言模型(HMLLM),探索不同人口统计、视频元素、脑电图和眼动追踪指标之间的关联。HMLLM可以弥合丰富模态之间的语义差距,并集成帧与帧之间的信息以执行逻辑推理。明略科技在Video-SME和其他基于视频的生成性能基准上设计了实验,大量实验评估证明了该方法的有效性。

什么是人的主观感受?

让机器学习、理解和模拟人类的主观感受,可能是赋予机器主观意识的开端。明略科技提出的新基准Video-SME有望成为该领域的新起点,标志着机器对视频的理解从客观维度向主观维度的转变。作为一种全新的范式,明略科技多模态大模型HMLLM的研发,致力于为该领域研究人员解决非标准模态问题提供宝贵经验与启示,从而促进大模型领域向人机协同的美好未来迈进。

本研究课题由科技部科技创新2030——“新一代人工智能(2030)”重大项目支持。

THE END
1.基于MOORS平台的研究性学习另一种是人际互动协作。依托MOORS平台,学生形成基于主题的研究性学习小组,或者基于研究项目的课题小组,每个小组都有导师参与引导,通过特定任务分配、驱动、交流、分享等,实现人际协作学习和协作研究。 研讨:圈层性 协作性学习或协作性研究,都是建立在以小组为单位的学习共同体之上展开,开展的过程,我们称之为研究性学习https://www.meipian.cn/1ye9de03
2.品牌文化MOORs一站式研学服务平台,隶属北京中教美育科技有限公司,聚焦于学习方式的重构,定位于研学教育生态的构建,从在线平台、研学服务、实践空间及创新教育平台定制开发与服务等方面合力打造面向未来的师、生、校成长体系,携手促进教师专业化研修成长、学生个性化自主成才、学校特色化卓越发展,踏实助力中国教育创新变革。 200https://moors.com.cn/brand
3.杨玉超研究方向:1) 基于大生产平台的忆阻器规模化集成技术与忆阻原理研究 2) 大算力、高能效存算一体化智能芯片 3) 基于忆阻器动力学的高阶复杂度类脑器件与智能系统 导师与研究领域、方向: 简要履历 杨玉超,北京大学长聘教授/博雅特聘教授,国家杰青,信息工程学院副院长,类脑智能芯片研究中心主任。长期从事忆阻器、类脑https://www.ece.pku.edu.cn/info/1045/2542.htm
4.硕士生导师全职导师(排名不分先后) 中文姓名 职称 电子信箱 张志庆教授zqzhang@must.edu.mo 孙 瑱教授zsun@must.edu.mo 柳旭东副教授xdliu@must.edu.mo 郭 羽副教授yuguo@must.edu.mo 王 迪副教授dwang@must.edu.mo 章戈浩助理教授ghzhang@must.edu.mo https://www.must.edu.mo/cn/cecp/44-academic/faculty-art/14727-supervisor-master-c
5.Moose人脉圈怎么样发现3+脉友Moose3名员工在脉脉活跃,他们担任运营、品质管理、调酒师等职务,办公地点位于杭州市。https://maimai.cn/mai/w1nECfGfPpjjVdwzPpfVh9T93p3hAL2djHx0r7qqUIw
6.100万+!再来人导师MSP平台服务总时长突破100万分钟名校留学国际教数据驱动的科学产品体系,是再来人国际教育打造高品质教育产品的核心,截止目前,再来人导师MSP平台服务总时长突破100万分钟,帮助学员斩获数以万计的世界名校offer。 再来人国际教育作为一家知名的教育服务品牌,十分重视导师选拔与培养,目前拥有近2,000位来自世界知名院校的“全明星阵容”师资团队,其中70%成员来自世界前10https://www.163.com/dy/article/IA6N31RT0518HPP9.html
7.超级导师实录丨找寻你的新闻媒体行业竞争力myOffer?从播音到新闻到翻译,她立志于成为最优秀的节目编导;从北京主播到专栏作者到伦敦中英主持人,她不断寻找着自己的职业竞争力。且听人美音甜的Stephanie氧气美女给我们带来怎样一场美与绝的盛宴!!!https://m.myoffer.cn/article/2570.html
8.杨耀东重点研究智能体安全交互与价值对齐问题,科研领域包括强化学习、AI对齐、博弈论和多智能体系统。发表AI领域顶会顶刊论文一百余篇,谷歌引用五千余次。曾获国际计算机视觉会议ICCV’23 最佳论文奖入围、机器人学习会议CoRL’20 最佳系统论文奖、多智能体系统会议AAMAS’21 最具前瞻性论文奖、世界人工智能大会(WAIC’22)https://www.berggruen.org.cn/fellows/yang-yao-dong
9.MOORs一站式研学服务平台的微博MOORs一站式研学服务平台。MOORs一站式研学服务平台的微博主页、个人资料、相册,北京青湖软件有限公司。新浪微博,随时随地分享身边的新鲜事儿。https://weibo.com/p/1005055592144767/home