大数据大算法大模型与产业发展 CCDE2023专题论坛

大数据、大算法、大模型与产业发展|CCDE2023专题论坛

近年来,大数据和人工智能技术高速发展,成为新一轮科技革命和产业变革的核心驱动力,释放出巨大价值,被广泛应用在工业制造、交通、金融、教育、医疗等各种行业,极大地促进了产业发展。大数据的发展为人工智能的训练和应用提供了海量的数据资源和计算能力,推动了人工智能技术的创新和突破,而人工智能又反过来促进了大数据的分析和利用。大数据和人工智能的发展赋能各行业的数字化转型,提升生产效率和创新能力,推动经济向数字化、网络化和智能化方向发展。为了探讨大数据、人工智能和数据经济产业发展问题,本论坛邀请专家学者分别就大数据、大算法、大模型、数字经济等问题表达自己的观点,并共同探讨如何在大数据和大模型科技和产业竞争中突围。

首届中国数字经济产业发展大会(CCDE2023)将于3月25日在苏州相城举办,大会将涵盖大数据产业、算力发展、数字金融产业、智能网联汽车产业、数字孪生技术、产业数字化、青年创新创业等话题。本文特别介绍将于25日下午举行的大数据、大算法、大模型与产业发展专题论坛。

+

一、论坛安排

地点:苏州市国际会议酒店(苏州市相城区相融路699号)

二、论坛议程

议程

嘉宾

13:00-13:30

13:30-13:45

领导致辞

黄宜华,CCF大数据专家委员会副主任,南京大学教授、大数据技术研究中心主任

邢鹏,苏州市相城区政府副区长

13:45-14:15

时空大数据联邦计算

童咏昕,CCF杰出会员,北京航空航天大学计算机学院教授

14:15-14:45

工业大数据技术与挑战

王晨,清华大学大数据系统软件国家工程研究中心总工程师、清华四川能源互联网研究院大数据研究所所长

14:45-15:15

认知智能大模型进展及其展望

谭昶,科大讯飞股份有限公司智慧城市事业群副总裁、讯飞大数据研究院院长

15:30-16:00

高通量药物发现人工智能大模型

彭绍亮,CCF杰出会员,国家超级计算长沙中心副主任

16:00-16:15

数据定价

王建冬,国家发展改革委价格监测中心副主任

16:15-17:00

圆桌论坛:中国如何在大数据和大模型科技和产业竞争中突围?

嘉宾:所有讲者

主持:黄宜华,南京大学教授、大数据技术研究中心主任,CCF大数据专家委员会副主任

三、论坛主席

程学旗

CCF会士、理事、大数据专家委员会秘书长。中国科学院计算技术研究所副所长、研究员,中国科学院网络数据科学与技术重点实验室主任,大数据分析系统国家工程研究中心理事长。

共同主席:

窦志成

CCF大数据专家委员会副秘书长,中国人民大学高瓴人工智能学院副院长、教授、博导,北京智源人工智能研究院“智能信息检索与挖掘”方向项目经理。

王莉

CCF高级会员、大数据专家委常委和副秘书长、人工智能与模式识别专家委委员、协同计算专委委员,太原理工大学教授、博士生导师、人工智能系主任、校学术委员会委员,山西省“大数据智能”科技创新团队负责人。

主要研究领域为大数据挖掘、知识图谱、工业智能等。承担完成科技部重大专项课题、国家基金、863、军科创新、山西省国际合作以及横向委托项目30余项。

四、报告嘉宾及摘要

童咏昕

【嘉宾简介】童咏昕,CCF杰出会员,北京航空航天大学计算机学院教授,博士生导师,国家自然科学基金优秀青年基金获得者。2014年于香港科技大学获计算机科学与工程学博士学位,随后留校担任研究助理教授,2015年入选北京航空航天大学“卓越百人计划”并加入软件开发环境国家重点实验室工作。目前主要研究方向包括:联邦学习、时空大数据分析与处理、众包计算与群体智能等。近年先后主持国家自然基金重点项目、国家重点研发计划课题等科研项目。共发表学术论文百余篇,谷歌学术引用8000余次。曾获中国电子学会自然科学一等奖(排名1)、首届阿里巴巴达摩院“青橙奖”和多个国际一流学术会议/竞赛的最佳论文与冠军;担任《FrontiersofComputerScience》期刊的执行编委、《IEEETKDE》与《IEEETBD》等国际期刊编委和多个CCF-A类会议程序委员会领域主席(PCAreaChair);也是CCF杰出会员、CCF会员与分部工委副主任、CCF走进高校工作组组长。

【报告题目】时空大数据联邦计算

【报告摘要】近年来随着市域社会治理与跨域交通管理等新需求的出现,在促进跨域时空数据流通的同时存在着泄露时空隐私的高风险,进而危害国家安全并影响社会治理。因此,如何在各部门原始数据不出本地的前提下,实现隐私安全的跨域协同分析成为时空大数据计算领域一项全新挑战?联邦计算以其“原始数据不出域、数据可用不可见”的共享理念为破解跨域数据要素流动问题提供了一种全新思路。本报告首先回顾时空联邦计算的背景,从数据库的视角回顾传统联邦数据库概念,介绍隐私可控的时空大数据联邦计算技术。随后介绍本团队结合产业应用需求所研发的时空联邦计算开源平台——“虎符(OpenHufu)”,其已经适配当前各种主流时空大数据计算平台,并支持多方数据自治环境下的安全高效协同查询。最后,报告也将介绍基于虎符系统的应用示范,并对该领域未来发展进行展望。

王晨

【嘉宾简介】王晨,清华大学大数据系统软件国家工程研究中心总工程师、清华四川能源互联网研究院大数据研究所所长,国家产业基础专家委员会委员,参与十四五大数据产业规划等多项国家级、部级信息化与大数据规划编制,领导实施多个制造业龙头企业工业大数据项目。曾担任IBM中国研究院主任研究员,数据管理技术研究部高级经理,IBM全球分析云研究战略负责人。同时在数据领域的顶尖国际会议与期刊上发表了50余篇论文,获得60余项中国、美国发明专利,担任多个学术会议审稿人,担任《大数据导论》、《工业大数据分析指南》、《工业大数据产业与技术白皮书》等多本著作编委。任工信部工业互联网产业发展联盟(AII)副秘书长,北京工业互联网技术创新与产业发展联盟秘书长,中国计算机学会数据库专委会委员,产学研工作组副组长,中国自动化学会大数据专委会委员,ACMSIGBEDChina常务委员,全国信标委工业APP工作组副组长、大数据工作组工业大数据专题组组长,国家工业信息安全发展研究中心科技委委员,Apache基金会IOTDB项目PMC,工信部工业强基、工业互联网等专项评审专家。曾获得北京市科技进步一等奖(2020),日内瓦发明金奖(2022)等科技奖励。

【报告题目】工业大数据技术与挑战

谭昶

【报告题目】认知智能大模型进展及其展望

【报告摘要】报告首先回顾人工智能发展阶段,介绍认知智能阶段的共性技术和典型应用,指出认知智能大模型是认知智能技术突破的重要方向。报告也系统分析了ChatGPT智慧涌现的特点及其背后的技术支撑,指出ChatGPT的成功是“数模算用”的系统性工程。最后结合讯飞实践给出中文大模型的可行性分析和建设思路,对大模型未来的产业化应用作一展望。

彭绍亮

【嘉宾简介】彭绍亮,CCF杰出会员,国家超级计算长沙中心副主任,湖南大学"岳麓学者"二级教授/博导。从事大数据、生物信息、人工智能、区块链等技术研究。出版学术专著7部,在NatureMachineIntelligence等期刊发表学术论文200余篇,论文引用8000余次。主持参与天河系列超级计算机应用软件研发工作,国家科技部、自然科学基金委重点项目,973/863项目等13项。获2019年国家科技进步二等奖,2019年湖南省技术发明一等奖(排名1),2013年军队科技进步一等奖1项,2021年CCF技术发明二等奖(排名1),2018年CCF自然科学二等奖(排名1),2016年立三等功。是中央军委科技委生物交叉立项专家组成员、国家科技部/工信部/教育部会评专家、中国计算机学会理事、CCF计算机应用和生物信息专委副主任和YOCSEF总部AC委员、CCF高性能计算专委常委、大数据专委常委、区块链专委委员,CCF杰出会员和杰出3星演讲者(CCF第二个)、湖南省生物信息学会理事长(发起人),担任2个SCI期刊执行主编和多个国际期刊副主编等。2020年联合创立全球第一个《Metaverse》元宇宙国际学术期刊,任Editor-in-Chief(主编),获得2022世界元宇宙生态大会元宇宙领军人物奖和2022“元宇宙30人创新人物奖”。

【报告题目】高通量药物发现人工智能大模型

【报告摘要】以AlphaFold为代表的人工智能药物发现(AIDD)技术提升了高通量数据产生和药物研发能力。由于广阔的结构空间、多变的生化性质、和训练数据稀疏导致的过拟合,导致现有AIDD技术存在海量高维异构数据、标注数据少、泛化能力弱、模型可解释性差、计算复杂度高等问题。团队基于海量的多源异构生物医药大数据,研究了高通量药物发现大模型关键技术。建立多任务协同预训练大模型,深度提取了融合分子结构和生物相互作用机制的多视图药物表征;研究了多模态联合深度学习技术,获得具有可解释性的节点嵌入表示,提升了AIDD模型的可解释性,还解决了已有方法不能预测训练数据集之外的样本问题,从而进行大规模精准药物发现(包括疾病分型、敏感性、不良反应、毒性等);研发了高通量虚拟药物筛选并行算法与分子测试技术,并实现了候选药物筛选和生物测试。形成一个从药物分子表征和生物异质网络到精准药物发现,再到靶标药物快速筛选和测试的全链条人工智能药物发现技术体系。实现了高通量药物大数据和人工智能双驱动下的干湿实验闭环研究,探索了大模型、人工智能和多模态大数据驱动下的药物研发新技术体系。

大会组委会特别邀请对“大数据、大算法、大模型与产业发展”等核心问题感兴趣或有经验、有想法的专业人士参加本次大会。因有苏州市相城区人民政府特别资助,参会者无需交费。大会场地有限,除特邀嘉宾外,其他嘉宾需提前报名才能参会。

THE END
1.我姓算,能力强,数字浪潮连接世界精准高效任翱翔家人们,谁懂啊!近期,“算力”一词频繁出现在各类科技新闻、产业发展报告甚至日常对话中——以数据、算法等为新生产要素的算力正以前所未有的广度和深度向社会各领域渗透融合,成为激活新质生产力的关键引擎。算力,顾名思义,就是计算机设备或数据中心处理信息的能力,是计算机硬件和软件配合共同执行某种计算需求的https://baijiahao.baidu.com/s?id=1818949109203476983&wfr=spider&for=pc
2.原创如何释放大模型对金融行业的价值?新闻频道大模型=大算力+大数据+强算法 今年以来ChatGPT风头强劲,带火了大模型技术。大模型即网络参数规模达到亿级以上的“预训练深度学习算法”,在文本图像理解、内容生成等任务表现出显著优势和巨大潜力。 “大模型必须基于‘大算力+大数据+大算法参数网络结构’进行训练。”吕仲涛介绍,大模型技术是一个复杂的体系性工程,涵盖https://news.hexun.com/2023-06-14/208961897.html
3.山东省大数据局省级层面上海市通信管理局等11个部门联合印发以构建支撑本市公共服务、商业服务的智能算力供给体系为指引,形成上海算力交易平台、上海市人工智能公共算力服务平台两大算力资源调度核心,以及面向智算应用的算力中心多极分布的“1+1+X”智能算力建设和服务体系,不断完善和深化探索算力、运力、存力协同布局的智能算力基础设施建设,聚焦智能芯片、算法模型、训练框架、计http://bdb.shandong.gov.cn/art/2024/4/1/art_329234_10326855.html
4.以算力算法强大大数据应用以创新生态壮大大数据产业6月10日,省委书记楼阳生在山西同方知网公司调研,了解大数据平台建设和应用情况。山西日报记者李联军摄 山西晚报讯(山西日报记者 陈俊琦)6月10日,省委书记楼阳生在太原市调研大数据产业发展并主持召开座谈会。他强调,要认真学习贯彻习近平总书记视察山西重要讲话重要指示精神和关于实施国家大数据战略的重要论述,以算力算法强大http://epaper.sxrb.com/wap/sxwb/20200611/506453.shtml
5.贵州省大数据局印发《面向全国的算力保障基地建设规划》贵州有着建设面向全国的算力保障基地多维度优势,政策方面,印发《国家大数据(贵州)综合试验区“十四五”建设规划》,提出要持续推进国家大数据综合试验区高质量建设,建成全国一体化大数据中心国家(贵州)枢纽节点。制定《贵州省新型数字设施中长期建设纲要》,提出着力做强数字新基建,将加快建设算力基础设施作为一项重大工作予以https://www.cbdio.com/BigData/2023-04/17/content_6172657.htm
6.全面落地金融业需要大数据大算力大合作大创新吕仲涛表示,大模型技术目前尚未完全成熟,而金融行业是一个强监管的行业。因此,大模型技术应用于金融场景下,仍然存在着安全隐私、科技伦理、可信可解释等方面的风险。同时,大模型技术应用全面落地的过程中,还面临着数据、算力、算法、应用等诸多挑战。 当前阶段不成熟,短期内不建议直接对客使用 https://static.nfapp.southcn.com/content/202309/11/c8090398.html
7.揭秘大模型背后的神秘力量:算力数据与算法的“黄金三角在人工智能的浩瀚星空中,大模型犹如一颗璀璨的新星,引领着技术的前沿。但你是否好奇,是什么让这颗新星如此耀眼?今天,就让我们一起揭开大模型背后的神秘面纱,探索那支撑其辉煌成就的“黄金三角”——算力、数据与高性能算法。 一、算力:大模型的超级引擎 https://cloud.tencent.com/developer/article/2453952
8.周志华:“数据算法算力”人工智能三要素,在未来要加上“知识”今天的人工智能热潮主要就是由于机器学习,特别是其中的深度学习技术取得巨大进展,而且是在大数据、大算力的支持下发挥出巨大的威力。 谈到深度学习,就要谈到深度神经网络。深度神经网络是非常庞大的系统,要训练出来需要很多数据、很强算力的支撑。人工智能算法模型对于算力的巨大需求,也推动了今天芯片业的发展。例如现在训练http://www.360doc.com/content/20/0811/08/54396214_929604489.shtml
9.AI大模型:大数据+大算力+强算法大模型算力算法数据AI大模型:大数据+大算力+强算法 前言:好久不见,甚是想念,我是辣条,我又回来啦,兄弟们,一别两年,还有多少老哥们在呢? 目录 一年半没更文我干啥去了? AI大模型火了 人工智能 大模型的理解 为什么学习大模型 大模型Function Calling功能增强 大模型接入公司的数据:embeddings&RAGhttps://blog.csdn.net/m0_65555479/article/details/139085917
10.地平线L4级AI芯片单挑英伟达,3岁壁仞创全球算力纪录,国产芯开挂了何为大模型?通俗讲,就是“大数据+大算力+强算法”的结合产物,是实现人工智能应用的载体。 如鹏城—百度·文心大模型,是去年底百度发布的全球最大的中文单体模型,并已大规模应用于百度搜索、信息流、智能音箱等产品。在金融领域,该模型能完成一份合同内近40个类目条款的智能分类,将处理单份合同文本的时长缩短至1https://www.jfdaily.com/wx/detail.do?id=523435
11.数据算法和算力:人工智能时代的三要素工业互联网观察当前的时代,无时无刻不在产生大数据。人手一部的手机、无处不在的摄像头和传感器等设备都在产生和积累着数据,这些数据形式多样化,大部分都是非结构化数据。 这些大数据需要进行大量的预处理过程(特征化、标量化、向量化),处理后的数据才能为人工智能算法所用。 https://www.shangyexinzhi.com/article/10565456.html
12.“移”起AI+丨“人工智能+”行动,中国移动怎么干?大平台派上“大用场” 模型不是直接“跑”在算力上,还需要平台来连接算力和应用,需要通过各种各样的平台工具,实现基础模型、行业模型到应用的跨越。中国移动自主研发的“九天”人工智能平台,就是面向个人及行业客户提供从算力、数据、算法框架到研发工具的全栈AI服务,并面向通用智能及大小模型训推场景,实现全面升级。https://www1.10086.cn/aboutus/news/groupnews/index_detail_49938.html
13.多城共同点亮人工智能算力网络,赋能人工智能产业发展深圳、武汉、西安、成都、北京、上海等21个城市共同点亮“人工智能算力网络”,通过“一网络”实现“算力、数据、生态”三汇聚,以“大算力+大数据”使能大模型,会上也发布了全球首个三模态大模型紫东.太初和生物信息研究平台鹏程.神农,通过大模型孵化新应用,推动AI产业发展。https://www.huawei.com/cn/news/2021/9/huawei-connect-2021-ai-matrix
14.美国最新芯片管制对国内供应链的影响华强资讯AI的发展离不开大算力、强算法、大数据三大要素。其中,大算力相当于人工智能的土壤,没有大算力的支持,就不会有AI的成功。 美国的“如意算盘”:卡住AI芯片的“脖子” 为了限制中国人工智能等高科技产业的发展,早在2022年10月7日,美国政府就规定算力上限为4800(INT8 超过 600TOPS 或 FP16 超过 300TFLOPS)以及带https://news.hqew.com/info-371137