大数据大算法大模型与产业发展 CCDE2023专题论坛

大数据、大算法、大模型与产业发展|CCDE2023专题论坛

近年来,大数据和人工智能技术高速发展,成为新一轮科技革命和产业变革的核心驱动力,释放出巨大价值,被广泛应用在工业制造、交通、金融、教育、医疗等各种行业,极大地促进了产业发展。大数据的发展为人工智能的训练和应用提供了海量的数据资源和计算能力,推动了人工智能技术的创新和突破,而人工智能又反过来促进了大数据的分析和利用。大数据和人工智能的发展赋能各行业的数字化转型,提升生产效率和创新能力,推动经济向数字化、网络化和智能化方向发展。为了探讨大数据、人工智能和数据经济产业发展问题,本论坛邀请专家学者分别就大数据、大算法、大模型、数字经济等问题表达自己的观点,并共同探讨如何在大数据和大模型科技和产业竞争中突围。

首届中国数字经济产业发展大会(CCDE2023)将于3月25日在苏州相城举办,大会将涵盖大数据产业、算力发展、数字金融产业、智能网联汽车产业、数字孪生技术、产业数字化、青年创新创业等话题。本文特别介绍将于25日下午举行的大数据、大算法、大模型与产业发展专题论坛。

+

一、论坛安排

地点:苏州市国际会议酒店(苏州市相城区相融路699号)

二、论坛议程

议程

嘉宾

13:00-13:30

13:30-13:45

领导致辞

黄宜华,CCF大数据专家委员会副主任,南京大学教授、大数据技术研究中心主任

邢鹏,苏州市相城区政府副区长

13:45-14:15

时空大数据联邦计算

童咏昕,CCF杰出会员,北京航空航天大学计算机学院教授

14:15-14:45

工业大数据技术与挑战

王晨,清华大学大数据系统软件国家工程研究中心总工程师、清华四川能源互联网研究院大数据研究所所长

14:45-15:15

认知智能大模型进展及其展望

谭昶,科大讯飞股份有限公司智慧城市事业群副总裁、讯飞大数据研究院院长

15:30-16:00

高通量药物发现人工智能大模型

彭绍亮,CCF杰出会员,国家超级计算长沙中心副主任

16:00-16:15

数据定价

王建冬,国家发展改革委价格监测中心副主任

16:15-17:00

圆桌论坛:中国如何在大数据和大模型科技和产业竞争中突围?

嘉宾:所有讲者

主持:黄宜华,南京大学教授、大数据技术研究中心主任,CCF大数据专家委员会副主任

三、论坛主席

程学旗

CCF会士、理事、大数据专家委员会秘书长。中国科学院计算技术研究所副所长、研究员,中国科学院网络数据科学与技术重点实验室主任,大数据分析系统国家工程研究中心理事长。

共同主席:

窦志成

CCF大数据专家委员会副秘书长,中国人民大学高瓴人工智能学院副院长、教授、博导,北京智源人工智能研究院“智能信息检索与挖掘”方向项目经理。

王莉

CCF高级会员、大数据专家委常委和副秘书长、人工智能与模式识别专家委委员、协同计算专委委员,太原理工大学教授、博士生导师、人工智能系主任、校学术委员会委员,山西省“大数据智能”科技创新团队负责人。

主要研究领域为大数据挖掘、知识图谱、工业智能等。承担完成科技部重大专项课题、国家基金、863、军科创新、山西省国际合作以及横向委托项目30余项。

四、报告嘉宾及摘要

童咏昕

【嘉宾简介】童咏昕,CCF杰出会员,北京航空航天大学计算机学院教授,博士生导师,国家自然科学基金优秀青年基金获得者。2014年于香港科技大学获计算机科学与工程学博士学位,随后留校担任研究助理教授,2015年入选北京航空航天大学“卓越百人计划”并加入软件开发环境国家重点实验室工作。目前主要研究方向包括:联邦学习、时空大数据分析与处理、众包计算与群体智能等。近年先后主持国家自然基金重点项目、国家重点研发计划课题等科研项目。共发表学术论文百余篇,谷歌学术引用8000余次。曾获中国电子学会自然科学一等奖(排名1)、首届阿里巴巴达摩院“青橙奖”和多个国际一流学术会议/竞赛的最佳论文与冠军;担任《FrontiersofComputerScience》期刊的执行编委、《IEEETKDE》与《IEEETBD》等国际期刊编委和多个CCF-A类会议程序委员会领域主席(PCAreaChair);也是CCF杰出会员、CCF会员与分部工委副主任、CCF走进高校工作组组长。

【报告题目】时空大数据联邦计算

【报告摘要】近年来随着市域社会治理与跨域交通管理等新需求的出现,在促进跨域时空数据流通的同时存在着泄露时空隐私的高风险,进而危害国家安全并影响社会治理。因此,如何在各部门原始数据不出本地的前提下,实现隐私安全的跨域协同分析成为时空大数据计算领域一项全新挑战?联邦计算以其“原始数据不出域、数据可用不可见”的共享理念为破解跨域数据要素流动问题提供了一种全新思路。本报告首先回顾时空联邦计算的背景,从数据库的视角回顾传统联邦数据库概念,介绍隐私可控的时空大数据联邦计算技术。随后介绍本团队结合产业应用需求所研发的时空联邦计算开源平台——“虎符(OpenHufu)”,其已经适配当前各种主流时空大数据计算平台,并支持多方数据自治环境下的安全高效协同查询。最后,报告也将介绍基于虎符系统的应用示范,并对该领域未来发展进行展望。

王晨

【嘉宾简介】王晨,清华大学大数据系统软件国家工程研究中心总工程师、清华四川能源互联网研究院大数据研究所所长,国家产业基础专家委员会委员,参与十四五大数据产业规划等多项国家级、部级信息化与大数据规划编制,领导实施多个制造业龙头企业工业大数据项目。曾担任IBM中国研究院主任研究员,数据管理技术研究部高级经理,IBM全球分析云研究战略负责人。同时在数据领域的顶尖国际会议与期刊上发表了50余篇论文,获得60余项中国、美国发明专利,担任多个学术会议审稿人,担任《大数据导论》、《工业大数据分析指南》、《工业大数据产业与技术白皮书》等多本著作编委。任工信部工业互联网产业发展联盟(AII)副秘书长,北京工业互联网技术创新与产业发展联盟秘书长,中国计算机学会数据库专委会委员,产学研工作组副组长,中国自动化学会大数据专委会委员,ACMSIGBEDChina常务委员,全国信标委工业APP工作组副组长、大数据工作组工业大数据专题组组长,国家工业信息安全发展研究中心科技委委员,Apache基金会IOTDB项目PMC,工信部工业强基、工业互联网等专项评审专家。曾获得北京市科技进步一等奖(2020),日内瓦发明金奖(2022)等科技奖励。

【报告题目】工业大数据技术与挑战

谭昶

【报告题目】认知智能大模型进展及其展望

【报告摘要】报告首先回顾人工智能发展阶段,介绍认知智能阶段的共性技术和典型应用,指出认知智能大模型是认知智能技术突破的重要方向。报告也系统分析了ChatGPT智慧涌现的特点及其背后的技术支撑,指出ChatGPT的成功是“数模算用”的系统性工程。最后结合讯飞实践给出中文大模型的可行性分析和建设思路,对大模型未来的产业化应用作一展望。

彭绍亮

【嘉宾简介】彭绍亮,CCF杰出会员,国家超级计算长沙中心副主任,湖南大学"岳麓学者"二级教授/博导。从事大数据、生物信息、人工智能、区块链等技术研究。出版学术专著7部,在NatureMachineIntelligence等期刊发表学术论文200余篇,论文引用8000余次。主持参与天河系列超级计算机应用软件研发工作,国家科技部、自然科学基金委重点项目,973/863项目等13项。获2019年国家科技进步二等奖,2019年湖南省技术发明一等奖(排名1),2013年军队科技进步一等奖1项,2021年CCF技术发明二等奖(排名1),2018年CCF自然科学二等奖(排名1),2016年立三等功。是中央军委科技委生物交叉立项专家组成员、国家科技部/工信部/教育部会评专家、中国计算机学会理事、CCF计算机应用和生物信息专委副主任和YOCSEF总部AC委员、CCF高性能计算专委常委、大数据专委常委、区块链专委委员,CCF杰出会员和杰出3星演讲者(CCF第二个)、湖南省生物信息学会理事长(发起人),担任2个SCI期刊执行主编和多个国际期刊副主编等。2020年联合创立全球第一个《Metaverse》元宇宙国际学术期刊,任Editor-in-Chief(主编),获得2022世界元宇宙生态大会元宇宙领军人物奖和2022“元宇宙30人创新人物奖”。

【报告题目】高通量药物发现人工智能大模型

【报告摘要】以AlphaFold为代表的人工智能药物发现(AIDD)技术提升了高通量数据产生和药物研发能力。由于广阔的结构空间、多变的生化性质、和训练数据稀疏导致的过拟合,导致现有AIDD技术存在海量高维异构数据、标注数据少、泛化能力弱、模型可解释性差、计算复杂度高等问题。团队基于海量的多源异构生物医药大数据,研究了高通量药物发现大模型关键技术。建立多任务协同预训练大模型,深度提取了融合分子结构和生物相互作用机制的多视图药物表征;研究了多模态联合深度学习技术,获得具有可解释性的节点嵌入表示,提升了AIDD模型的可解释性,还解决了已有方法不能预测训练数据集之外的样本问题,从而进行大规模精准药物发现(包括疾病分型、敏感性、不良反应、毒性等);研发了高通量虚拟药物筛选并行算法与分子测试技术,并实现了候选药物筛选和生物测试。形成一个从药物分子表征和生物异质网络到精准药物发现,再到靶标药物快速筛选和测试的全链条人工智能药物发现技术体系。实现了高通量药物大数据和人工智能双驱动下的干湿实验闭环研究,探索了大模型、人工智能和多模态大数据驱动下的药物研发新技术体系。

大会组委会特别邀请对“大数据、大算法、大模型与产业发展”等核心问题感兴趣或有经验、有想法的专业人士参加本次大会。因有苏州市相城区人民政府特别资助,参会者无需交费。大会场地有限,除特邀嘉宾外,其他嘉宾需提前报名才能参会。

THE END
1.机器学习十大算法模型详细介绍线性回归是一种用于建立变量之间线性关系的机器学习算法。它通过拟合一条直线或超平面来预测连续型变量的值。线性回归模型基于最小二乘法,通过最小化实际值与预测值之间的差异来确定最佳拟合线。二、逻辑回归(Logistic Regression)逻辑回归是一种用于建立分类模型的机器学习算法。它通过将线性回归模型的输出映射到一个https://baijiahao.baidu.com/s?id=1775984247015265283&wfr=spider&for=pc
2.电子商务行业大数据分析采用的算法及模型有哪些?电子商务行业大数据分析采用的算法及模型有哪些? 第一、RFM模型 通过了解在网站有过购买行为的客户,通过分析客户的购买行为来描述客户的价值,就是时间、频率、金额等几个方面继续进行客户区分,通过这个模型进行的数据分析,网站可以区别自己各个级别的会员、铁牌会员、铜牌会员还是金牌会员就是这样区分出来的。同时对于一些https://m.hqqt.com/wenda/16267676914903.html
3.大数据分析的算法模型有哪些大数据分析的算法模型有哪些大数据算法分析入门 算法算法(algorithm)是为求解一个问题需要遵循的、被清楚地指定的简单指令的集合。 数学基础1. 大O表示法: 如果存在正常数 c 和 n0 使得当 N ≥ n0时,T(N) ≤ cf(N),则记为T(N) = O(f(N))。 (描述了T(N)的相对增长率小 https://blog.51cto.com/topic/f40e0269c86d076.html
4.大数据模型有哪些关联规则挖掘模型:主要用于在大数据中发现两个或多个项之间的相关性。 例如,在购物网站中,可以使用关联规则挖掘模型发现哪些商品会一起被购买,进而实现交叉销售和商品推荐。 常见的算法有Apriori算法和FP-growth算法。 聚类模型:主要用于将数据分成不同的组或类,每个组或类中的数据具有相似的特征。 https://www.ai-indeed.com/encyclopedia/10729.html
5.大数据分析模型有哪些知乎帆软数字化转型知识库上述这些大数据分析模型各自有其独特的应用场景和优势,选择合适的模型取决于具体的数据特征和分析需求。在实际应用中,往往需要结合多种模型和技术,以实现最佳的分析效果。 相关问答FAQs: 1. 大数据分析模型有哪些常见类型? 大数据分析模型是指在处理海量数据时所采用的一系列算法和方法。常见的大数据分析模型包括:关联规则https://www.fanruan.com/blog/article/66440/
6.大数据基础知识科普丨大数据的类型非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片, HTML、各类报表、图像和音频/视频信息等等。 非结构化数据的特点是存储占比高、数据格式多样、结构不标准且复杂、信息量丰富、处理https://mp.weixin.qq.com/s?__biz=MzI4MjE0NDQ5OA==&mid=2651056542&idx=7&sn=a9462fd07d22c6bdb6c539112c677292&chksm=f19f3a990e33a4ce4c25e5cc33bf7434a34d73a1807eda8c7baf94d5cc16aa17c6d538b636b5&scene=27
7.经典!10大数据挖掘算法!国际权威的学术组织 the IEEE International Conference on Data Mining (ICDM) 早前评选出了数据挖掘领域的十大经典算法: C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART。…https://zhuanlan.zhihu.com/p/688376648
8.大数据分析中常用的算法有哪些?大数据分析中常用的算法有哪些? 收藏 大数据分析是指通过处理和分析大规模数据集来提取有价值的信息和洞察力,以支持决策和解决问题。在大数据分析中,有许多常用的算法被广泛应用。以下是一些常见的大数据分析算法: 线性回归:线性回归是一种基本的统计分析方法,用于建立一个线性模型来描述变量之间的关系。在大数据分析中https://www.cda.cn/view/203010.html
9.干货一文读懂工业大数据的算法与模型基本知识与应用算法和模型是大数据分析系统中的两个问题,很多时候人们无法将这两个概念准确的区分开来,或者在某些场景下经常把算法和模型当做是同一个概念。实际上,算法和模型是有紧密联系的。 数据分析的算法是一般规则,所采用的方法是具有通用性和一般性的,如果需要用算法来解决实际的问题,达到商业的价值,就需要将算法和实际的应https://www.evget.com/doclib/s/14/10645
10.大模型和大数据的区别大模型和小模型的区别→MAIGOO知识摘要:大模型是指具有数百万或数十亿个参数的深度神经网络模型,这种模型经过专门的训练过程,能够对大规模数据进行复杂的处理和任务处理。本文将为大家介绍大模型和大数据的区别、大模型和小模型的区别、大模型和AIGC的区别等内容,希望能对您提供帮助和参考。 https://www.maigoo.com/goomai/1zEMMDMz.html
11.省大数据局关于印发贵州省数据要素登记服务管理办法(试行)的通知第一条 为规范数据要素登记服务,保护登记主体的合法权益,激活数据要素潜能,根据有关法律、行政法规,结合本省实际,制定本办法。 第二条 本办法所称数据要素登记,是指登记服务机构将数据要素内容和其他法定事项记录于登记凭证的行为。 本办法所称数据要素,是指数据资源、算法模型、算力资源以及综合形成的产品等。 https://www.yinjiang.gov.cn/jgsz/zfbm/gyhswj/zfxxgk/fdzdgknr_5698460/kjcx_5698925/202312/t20231205_83203250.html
12.大数据分析是什么可以通过网络爬虫,或者历年的数据资料,建立对应的数据挖掘模型,然后采集数据,获取到大量的原始数据。 (3)导入并准备数据 在通过工具或者脚本,将原始转换成可以处理的数据。 2、大数据分析算法 机器学习,通过使用机器学习的方法,处理采集到的数据。根据具体的问题来定。这里的方法就特别多。 https://www.linkflowtech.com/news/2090
13.数据挖掘论文的参考文献绝大读书数据挖掘岗位都是做应用,数据清洗,用现成的库建模,如果你自己不往算法或者架构方面继续提升,和其他的开发岗位的性质基本没什么不同,只要会编程都是很容易入门的。 2.北上广以外的普通公司用的多吗?待遇如何? 实际情况不太清楚,由于数据挖掘和大数据这个概念太火了,肯定到处都有人招聘响应的岗位,但是二线城https://www.yjbys.com/bylw/cankaowenxian/76866.html
14.探索与实践以《大数据分析实务》课程为例基于课程重点学习的大数据算法,教学团队自主研发了学生行为评价与预测系统,并详细制定了7个学习评价指标。教学过程中通过对学生的线上和线下7个学习评价指标进行数据记录。课后,将记录的数据输入学生行为评价与预测系统,通过评价模型实现增值评价和综合评价,并通过4个大数据算法模型对未来的学习行为模式和可能出现的学习成效https://www.gzqy.cn/sgxjsztw/info/1043/1726.htm
15.针对公安民警开展数据建模方法的研究和实践本文旨在探索一种面向广大民警的可视化建模方法,通过放开数据操作权限、赋予可视化建模能力,催生更多警务应用模型。 导读 2018年3月,公安部科技信息化局以公安基层技术革新奖推荐评选为载体,以公安大数据建设应用为主线,组织开展了“智慧公安我先行”全国公安基层技术革新专项活动。新智认知自主研发的产品“自主数据建模的可https://www.secrss.com/articles/7120
16.傅才武?明琰:数字技术语境下两种文化的对话过去我们认为机器无法抵达的文学、艺术等精神空间已开始由大数据支撑下的算法模型编码、解码、训练及重构成可人机互动的符号体系。可见数字技术通过推动人工系统智能化,已逐渐在自然系统和人类系统间架起了双向沟通的桥梁,科学文化和人文文化在实践意义上已经有了对话的雏形。https://m.hbskw.com/p/65467.html
17.电气工程与控制科学学院报告会:大数据研发中的智能算法——从介绍大数据研发中的核心技术——算法,也即人类记忆、回溯、认知和推理过程中的高效计算方法与算法模型。包括二大类:结构化数据的逻辑关联分析、及非结构化数据的语义关联分析,涉及复杂网络模型、图计算模型、数据挖掘、数据建模、动态规划、符号计算、计算机语义学、人工智能、机器学习等。主讲人将结合他们的算法研究实践https://eecs.njtech.edu.cn/info/1049/1585.htm
18.年薪50万!北航合肥创新研究院招募研究员!澎湃号·政务4、了解CV、机器学习、深度学习或强化学习、大数据分析等常用算法及模型,具备较强的编程能力,熟悉Tensorflow等机器学习平台; 5、有重大基础研究和应用研究经验者以及具备产学研合作和科技成果转化经验者优先; 6、能紧跟自身科研领域的发展方向,具有较强的团结协作、拼搏奉献精神,能够协助团队负责人开展科研管理工作。 https://www.thepaper.cn/newsDetail_forward_4985535