ADL125期《AI+DB》开始报名

本期CCF学科前沿讲习班ADL125《AI+DB》,将对AI与DB相结合的基础、前沿进展和典型应用进行系统性介绍。帮助学员在了解DB基本概念的基础上,从入门到前沿快速深入地掌握如何利用AI技术提升DB性能,以及业界如何应用AI解决DB问题。同时,帮助学员了解如何利用DB技术赋能AI,提升训练推理效率与模型性能。相信学员经过本次讲习班,能够深入了解AI+DB的基本原理、主要挑战和应用场景,开阔科研视野,增强实践能力。

学术主任:李国良清华大学、柴成亮清华大学

特邀讲者:

李国良清华大学

讲者简介:李国良,清华大学计算机系教授,系副主任。主要研究数据库、大数据挖掘与分析。在数据库顶级会议和期刊上发表论文150余篇,他引12000余次。主持国家杰青、优青、青年973、重点等项目。获得了VLDB杰出青年贡献奖、IEEE数据工程领域杰出新人奖、计算机学会青年科学家奖等奖项。SIGMOD2021大会主席、VLDB2021Demo主席、ICDE2022Industry主席。获得过BestofVLDB2020/ICDE2018/KDD2018,CIKM2017BestPaper。获得过国家科技进步二等奖、江苏省科技进步一等奖、国家电网科技进步一等奖等奖项。

报告题目:机器学习赋能的数据库系统

报告摘要:本报告主要讲述如何使用机器学习技术来优化数据库,包括(1)基于机器学习的优化器(学习型基数和代价估计、学习型查询重写、学习型物理优化);(2)基于机器学习的数据库配置优化(基于机器学习的分布键推荐、索引推荐、视图推荐、参数推荐);(3)学习型数据结构(学习型索引);(4)基于机器学习的查询与数据生成(SQL生成、数据生成、SQL预测);(5)基于机器学习的系统诊断(慢SQL诊断、系统诊断)等。本报告还将数据库优化问题分成NP优化问题、回归问题、预测问题,并讲述如何利用机器学习算法(深度学习、强化学习、元学习、图学习等)来解决这些问题。最后本报告还介绍研究趋势和未来挑战。CeZhangETHZurich

讲者简介:CeisanAssistantProfessorinComputerScienceatETHZurich.Themissionofhisresearchistomakemachinelearningtechniqueswidelyaccessible---whilebeingcost-efficientandtrustworthy---toeveryonewhowantstousethemtomakeourworldabetterplace.Hebelievesinasystemapproachtoenablingthisgoal,andhiscurrentresearchfocusesonbuildingnext-generationmachinelearningplatformsandsystemsthataredata-centric,human-centric,anddeclarativelyscalable.BeforejoiningETH,CefinishedhisPhDattheUniversityofWisconsin-MadisonandspentanotheryearasapostdoctoralresearcheratStanford,bothadvisedbyChristopherRé.HisworkhasreceivedrecognitionssuchastheSIGMODBestPaperAward,SIGMODResearchHighlightAward,GoogleFocusedResearchAward,anERCStartingGrant,andhasbeenfeaturedandreportedbyScience,Nature,theCommunicationsoftheACM,andavariousmediaoutletssuchasAtlantic,WIRED,QuantaMagazine,etc.

报告题目:EfficientIn-DatabaseMachineLearningwithDeepPhysicalIntegration

报告摘要:Today,trainingmachinelearninginsidedatabasesusinglibrariessuchasMADlibcouldbeordersofmagnitudeslowerthanitsnon-DBcounterpart(e.g.,PyTorchoverfiles).IsthisslowdownaninevitablepricethatwehavetopayinordertoenjoyalltheothergreatbenefitsthatadatabaseprovidesWehopetheanswerisno---inthistalk,IwillpresentoureffortsinoptimizingMLtraininginsidedatabasesystems.WeintegratedMLtrainingasacollectionofphysicaloperators,averydifferentdesigndecisioncomparedwithotherin-DBMLsolutions.Thisdeepintegration,alongwithseveralnovelalgorithms,allowsustoclosethisDB/non-DBgapforarangeofMLmodels.

丁博麟阿里巴巴

讲者简介:丁博麟,阿里巴巴-智能计算实验室资深技术专家。于中国人民大学完成数学与应用数学本科学习,后前往香港中文大学和美国伊利诺伊大学香槟分校,分别获得系统工程硕士和计算机科学博士。研究方向包括:数据隐私保护,智能系统(AI4AI,AI4DB,AI4Econ),机器学习算法理论及应用。2018年4月加入阿里巴巴。之前就职于美国微软研究院任研究员。项目成果被授予十余项美国技术专利,多项成果直接应用于业界重要软件和服务。研究成果发表于SIGMOD,VLDB,ICDE,KDD,NIPS,ICML,ICLR,CHI等多个领域的顶尖国际会议。

报告题目:智能数据库技术:理论到实践、机遇和挑战

报告摘要:为了提高大数据系统的竞争力,优化数据库运行效率和降低资源消耗是两个关键技术发力点,也是数据管理系统研究方向一直以来的研究热点。在最近五年,研究人员开始探索如何利用机器学习技术优化数据库系统(AI4DB),其中不少成果在实验室环境中的标准benchmark上有非常优异的表现,但是一直未能有成熟的技术大规模落地应用于实际场景中的大数据系统并创造商业和生产价值。我们希望继续在该方向进行科研探索,并探究现在这个方向上前沿技术和研究成果与实际系统应用的差距。这次报告会介绍我们在AI4DB几个方向上研究的进展和思考,包括基于机器学习的参数估计、数据索引、查询优化,从理论和实践的角度分别探讨为什么基于机器学习的数据库技术具备潜力和可行性,以及需要什么样的系统支持。

孙佶华为

讲者简介:孙佶,任职于华为高斯实验室,数据库助理首席专家。于北京邮电大学计算机学院获得工学学士学位,后于清华大学计算机系获得工学博士学位。研究方向包括:AI与数据库交叉技术(AI4DB,DB4AI)、数据库近似检索技术以及机器学习算法理论及应用。研究成果发表于SIGMOD,VLDB,ICDE等数据库顶尖国际会议。曾获得CCF优秀博士论文奖,北京市优秀毕业生,SigmodProgrammingContest优胜奖等荣誉。

报告题目:openGauss:构建内外兼修的数据库智能自治能力

报告摘要:随着生产环境中的负载和数据的复杂性以及运行环境的异构性,依赖于简单规则和专家经验的传统数据库系统,在执行效率、可维护性以及可用性上面临巨大的挑战。比如负载和数据的复杂性很容易导致数据库配置参数失效以及代价估计系统奔溃;而运行环境的异构性则导致了数据库性能问题诊断和治愈难度陡增。针对这些数据库痛点,学术界在近几年尝试使用机器学习的方法进行解决,取得了令人瞩目的实验效果;工业界也进行了AI和数据库交叉技术的实践,并且诞生了一些利用AI算法进行数据库辅助调优的产品,取得了很好的商业效果。openGauss作为一款针对智能自治能力构建设计的数据库,具备强大的性能自监控以及原生AI计算能力,我们研发出的数据库运行管理和内核优化组件服务于云平台以及客户生产环境中。本次报告介绍openGauss中的AI原生架构、自监控自诊断能力以及智能优化器(ABO)的研发进展,并且介绍我们对AI原生数据库的挑战以及未来发展方向的思考。

TimKraskaMIT

报告题目:Towardsinstance-optimizeddatasystems

报告摘要:Recently,therehasbeenalotofexcitementaroundML-enhanced(orlearned)algorithmsanddatastructures.Forexample,therehasbeenworkonapplyingmachinelearningtoimprovequeryoptimization,indexing,storagelayouts,scheduling,log-structuredmergetrees,sorting,compression,sketches,amongmanyotherdatamanagementtasks.Arguably,theideasbehindthesetechniquesaresimilar:machinelearningisusedtomodelthedataand/orworkloadinordertoderiveamoreefficientalgorithmordatastructure.Ultimately,whatthesetechniqueswillallowustobuildare“instance-optimized”systems;systemsthatself-adjusttoagivenworkloadanddatadistributiontoprovideunprecedentedperformanceandavoidtheneedfortuningbyanadministrator.Inthistalk,IwillfirstprovideanoverviewoftheopportunitiesandlimitationsofcurrentML-enhancedalgorithmsanddatastructures,presentinitialresultsofSageDB,afirstinstance-optimizedsystemwearebuildingaspartofDSAIL@CSAILatMIT,andfinallyoutlineremainingchallengesandfuturedirections.

伍赛浙江大学

报告题目:ZenDB:ADeclarativeAI-enhancedDatabaseSystem

ArunKumarUCSD

讲者简介:ArunKumarisanAssociateProfessorintheDepartmentofComputerScienceandEngineeringandtheHaliciogluDataScienceInstituteandanHDSIFacultyFellowattheUniversityofCalifornia,SanDiego.Hisprimaryresearchinterestsareindatamanagementandsystemsformachinelearning/artificialintelligence-baseddataanalytics.SystemsandideasfromhisworkhavebeenreleasedaspartoftheApacheMADlibopen-sourcelibraryandshippedaspartofproductsfromorusedinternallybymanydatabase,Web,andcloudcompanies.HeisarecipientofthreeSIGMODresearchpaperawards,fourdistinguishedreviewer/metareviewerawardsfromSIGMOD/VLDB,theIEEETCDERisingStarAward,anNSFCAREERAward,andresearchawardgiftsfromAmazon,Google,Oracle,andVMware.

报告题目:TheNewDBficationofML/AI

报告题目:面向人工智能的数据准备技术:机遇与挑战

姚权铭清华大学

讲者简介:姚权铭是清华大学电子工程系助理教授。他于香港科技大学计算机系取得博士学位,之后加入第四范式担任高级科学家,创建和领导公司的机器学习研究组。该团队为国内最早一批从事自动化机器学习的研究团队。他已发表CCF-A类论文50余篇,谷歌学术引用3800余次。其中,抗噪标签算法Co-teaching(NeurIPS2018)为当年10大高引论文之一,小样本领域概述论文(CSUR2020)为ESI热点论文(前0.1%被引),图数据自动化学习方法PAS(CIKM2021)和AutoSF(TPAMI2022)为OGB榜单问鼎算法。最后,他也是机器学习主要会议ICML/NeurIPS/ICLR的领域主席、NeuralNetwork期刊的编委、NeurIPS首届AutoML比赛的举办者之一。

报告题目:自动化机器学习原理方法与应用

学术主任

李国良,清华大学计算机系教授,系副主任。主要研究数据库、大数据挖掘与分析。在数据库顶级会议和期刊上发表论文150余篇,他引12000余次。主持国家杰青、优青、青年973、重点等项目。获得了VLDB杰出青年贡献奖、IEEE数据工程领域杰出新人奖、计算机学会青年科学家奖等奖项。SIGMOD2021大会主席、VLDB2021Demo主席、ICDE2022Industry主席。获得过BestofVLDB2020/ICDE2018/KDD2018,CIKM2017BestPaper。获得过国家科技进步二等奖、江苏省科技进步一等奖、国家电网科技进步一等奖等奖项。

柴成亮,清华大学博士后。研究领域:数据库、数据挖掘、数据准备等。在CCFA类会议和期刊发表论文30余篇,包括SIGMOD、VLDB、ICDE等。担任多个国际会议与期刊如VLDB、ICDE、KDD、AAAI的审稿人。获得过CCF优博、ACM中国优博等奖项。主持博新计划、国自然青年基金和博士后面上基金等。

线下地址(疫情允许的情况下):北京中国科学院计算技术研究所一层报告厅(北京市海淀区中关村科学院南路6号)

线上地址:报名交费成功后通过邮件发送。

报名须知:

1、报名费:CCF会员2800元,非会员3600元。食宿交通费用自理。根据交费先后顺序,会员优先的原则录取,额满为止。疫情期间,根据政府疫情防控政策随时调整举办形式(线上、线下)。

THE END
1.机器学习算法原理与代码实战案例讲解带数据集的机器学习代码csdn机器学习算法原理与代码实战案例讲解 1.1人工智能的兴起与机器学习的崛起 近年来,人工智能(AI)技术取得了显著的进展,并在各个领域得到广泛应用。机器学习作为人工智能的核心领域之一,其重要性与日俱增。机器学习算法通过分析大量数据,自动学习规律和模式,并根据学习到的知识进行预测和决策,为解决复杂问题提供了新的思路https://blog.csdn.net/2401_85133351/article/details/139133529
2.机器学习原理与代码实例讲解《机器学习原理与代码实例讲解》 概述 在人工智能领域,机器学习是核心支柱之一。它通过算法让计算机自动从数据中学习规律,无需显式编程。本文章旨在系统讲解机器学习的基础原理、常用算法,并通过代码实例加深理解,帮助读者掌握这一重要技术。 文章核心关键词包括:机器学习、监督学习、无监督学习、强化学习、深度学习、特征https://blog.51cto.com/universsky/12684867
3.机器视觉与机器学习算法原理框架应用与代码实现,机械工业当当新华书店大石桥旗舰店在线销售正版《【新华书店自营旗舰店】机器视觉与机器学习 算法原理、框架应用与代码实现,机械工业出版社》。最新《【新华书店自营旗舰店】机器视觉与机器学习 算法原理、框架应用与代码实现,机械工业出版社》简介、书评、试读、价格、图片等相关信http://product.dangdang.com/11926094501.html
4.机器学习机器学习的基本概念算法的工作原理实际应用案例二、机器学习算法的工作原理 监督学习算法 线性回归:用于回归任务,通过寻找一条直线来拟合数据点,最小化预测值与实际值之间的差距。 逻辑回归:用于分类任务,尽管名称中有“回归”二字,但它实际上是一种分类算法,用于预测事件发生的概率。 决策树:通过构建一棵树形结构来进行决策。每个内部节点代表一个属性上的测试,https://developer.aliyun.com/article/1588759
5.从零开始:机器学习的数学原理和算法实践(3)算法与代码详解。第7~第14章讲述各个典型算法的来龙去脉,用最直观形象的语言描述最本质的原理,使零基础读者也能够快速理解算法原理。 本书充分考虑了零基础读者希望深度理解机器学习算法原理的需求,力求在直观形象、通俗易懂与深度讲解之间取得较好的平衡。本书主要面向下述读者群体。 https://www.epubit.com/bookDetails?id=UB77b8ad3a2522b
6.《机器学习算法原理和编程实践》.pdf《机器学习算法原理和编程实践》.pdf,第一章 机器学习的基础 “基础决定高度,而不是高度决定基础。” 机器学习脱胎于人工智能,自诞生开始,就充满了挑战,这个领域从来都吸引了 全世界最顶尖的科学家,本书所讲述的正是他们多年的研究成果。对于普通读者而言, 快速而全面https://max.book118.com/html/2016/0303/36760986.shtm
7.机器学习:公式推导与代码实现最新章节作为一门应用型学科,机器学习植根于数学理论,落地于代码实现。这就意味着,掌握公式推导和代码编写,方能更加深入地理解机器学习算法的内在逻辑和运行机制。本书在对全部机器学习算法进行分类梳理的基础之上,分别对监督学习单模型、监督学习集成模型、无监督学习模型、概率模型四个大类共26个经典算法进行了细致的公式推导和https://read.qq.com/detail/1044579026
8.清华大学出版社图书详情机器学习——原理、算法与应用 配套PPT,资源咨询请加QQ:2301891038(仅限教师)。理论讲解透彻深刻。主要机器学习算法的推导、证明过程完整而且清晰,并介绍了每种算法背后的思想,这是市面上目前其他教程所不具有的 作者:雷明 ? 定价:88元 印次:1-10 ISBN:9787302532347 出版日期:2019.09.01 印刷日期:2024.0http://www.tup.tsinghua.edu.cn/booksCenter/book_08393801.html
9.机器学习——原理算法与应用(豆瓣)第4~22章为第二部分,是本书的主体,介绍各种常用的有监督学习算法、无监督学习算法、半监督学习算法和强化学习算法。对于每种算法,从原理与推导、工程实现和应用3个方面进行介绍,对于大多数算法,都配有实验程序。第23章为第三部分,介绍机器学习和深度学习算法实际应用时面临的问题,并给出典型的解决方案。https://book.douban.com/subject/34809758/
10.中科院软件所天基综合信息系统重点实验室招聘启事2、信号与信息处理算法设计工作,为下列工作之一:SAR成像、SAR运动目标检测等; 3、信号与信息处理软件开发验证工作。 4、参与嵌入式系统、海洋调查显控软件和数据库的开发,负责代码编写和调试、测试; 5、负责数字信号处理算法的设计和实现; 6、负责项目中部分算法设计工作,包括机器学习(自然语言处理、图像分析识别、规律http://www.bjb.cas.cn/zpxx2016/202108/t20210818_6158385.html
11.机器学习与深度学习习题集答案1腾讯云开发者社区文章被收录于专栏:SIGAI学习与实践平台 本文是机器学习和深度学习习题集的答案-1,免费提供给大家,也是《机器学习-原理、算法与应用》一书的配套产品。此习题集可用于高校的机器学习与深度学习教学,以及在职人员面试准备时使用。 第2章 数学知识 1.计算下面函数的一阶导数和二阶导数 根据基本函数,复合函数,四则运算https://cloud.tencent.com/developer/article/1563493
12.机器学习从原理到应用图书针对每个机器学习模型,本书详细地介绍了其原理、形式、函数(损失函数和正则项)、优化方法以及应用案例;公式推导较为详尽,语言表述通俗易懂,可减轻读者学习负担,提升读者学习效果。(3)理论实践紧密结合,应用案例完全落地。 针对应用案例,本书选用了Kaggle平台上提供的数据,并在对应的代码中给出了机器学习项目的完整步骤https://www.ryjiaoyu.com/book/details/9178
13.机器学习原理及应用PPT课件(附教学大纲习题及答案)下载机器学习原理及应用 PPT课件 1. 机器学习概述(2学时) 了解机器学习的组成;了解不同划分标准下的机器学习算法;理解分类问题和回归问题;理解监督学习、半监督学习和无监督学习;了解生成模型和判别模型;了解模型评估方法;了解正则化处理;了解并使用Python的sklearn模块; 2. 逻辑回归及最大熵模型(2学时) 了解并掌握线性https://www.kj009.net/web2/mj07b34681.html
14.机器学习算法原理与编程实践(郑捷)完整pdf扫描版[126MB]电子书下应用平台:PDF 更新时间:2017-01-18 购买链接:京东异步社区 网友评分: 360通过腾讯通过金山通过 125.9MB 广告 商业广告,理性选择广告 商业广告,理性选择广告 商业广告,理性选择广告 商业广告,理性选择 详情介绍 机器学习算法原理与编程实践是机器学习原理和算法编码实现的基础性读物,内容分为两大主线:单个算法的原理讲解https://www.jb51.net/books/527823.html
15.机器学习/算法校招面试考点汇总(附面试题和答案)持续更新4、矩阵正定性的判断,Hessian矩阵正定性在梯度下降中的应用 5、概率题:抽蓝球红球,蓝结束红放回继续,平均结束游戏抽取次数 6、讲一下PCA 7、拟牛顿法的原理 8、编辑距离 二、机器学习算法 1、处理分类问题常用算法 1、交叉熵公式 2、LR公式 3 LR的推导,损失函数 https://www.nowcoder.com/discuss/165930
16.《scikitlearn机器学习:常用算法原理及编程实战》黄永昌.pdfscikit-learn机器学习 常用算法原理及编程实战黄永昌编着 第1章机器学习介绍,涵盖了机器学习的定义、应用场景及机器学习的分类,并通过一个简单的示例,让读者了解机器学习的典型步骤和机器学习领域的一些专业术语。 第2章Python机器学习软件包,介绍了scikit-learn开发环境的搭建步骤,以及IPython、Numpy、Pandas和Matplotlib等https://www.iteye.com/resource/weixin_38291399-11229426
17.scikitscikit-learn机器学习:常用算法原理及编程实战 计算机与互联网…|7436499 mobi epub pdf txt 电子书 下载 2024 - 图书大百科https://book.qciss.net/books/25605687419