近日,全球人工智能顶会AAAI2021以虚拟形式在线召开,并于会前公布了论文收录结果。AAAI2021投稿论文总数达到“惊人的高技术水平”,9034篇投稿论文中,7911篇接受评审,最终1692篇被录取,录取率为21%;百度再创佳绩,一举贡献24篇优质学术论文,涵盖计算机视觉、自然语言处理、知识图谱、量子机器学习等多个领域,展示出行业领先的AI技术实力,同时这些技术创新和突破将有助于推进智能对话、智能办公、智慧医疗、智慧金融、智能交通等场景的落地应用,加速中国智能经济时代的到来。
资料显示,AAAI是国际AI领域历史最悠久、涵盖内容最广泛的国际顶级学术会议之一。会议的目的是促进人工智能(AI)领域的研究,以及人工智能研究人员、从业人员、科学家和附属学科工程师之间的科学交流。
以下为百度AAAI2021部分收录论文的亮点集锦。
1、ERNIE-ViL:融合场景图知识的视觉-语言跨模态预训练技术
ERNIE-ViL:KnowledgeEnhancedVision-LanguageRepresentationsthroughSceneGraph
2、基于实体结构建模的文档级关系抽取
EntityStructureWithinandThroughout:ModelingMentionDependenciesforDocument-LevelRelationExtraction
3、MVFNet:用于高效视频识别的多视角融合网络
MVFNet:Multi-ViewFusionNetworkforEfficientVideoRecognition
4、一种基于关键点聚合网络的实时任意形态文字端到端框架
PGNet:Real-timeArbitrarily-ShapedTextSpottingwithPointGatheringNetwork
5、基于变分影子量子学习的分类算法
VSQL:VariationalShadowQuantumLearningforClassification
机器学习擅长处理结构化的数据特征,其中分类问题因为其泛用性一直处于核心的研究地位。近年来随着量子机器学习的兴起,研究者们开始探索如何采用量子神经网络去完成针对经典和量子数据的分类任务。然而由于目前量子设备的局限性,训练过程中会出现诸多问题,例如:参数过多,训练代价太大,测试精度不高等等。针对这些不足,本文提出了一种基于“变分影子量子学习”的分类算法,该算法采用了一种特殊的“影子电路”组成的量子神经网络架构,通过滑动的影子电路提取特征信息。该工作基于百度飞桨上的量子机器学习工具集量桨(qml.baidu.com)研发,数值实验结果表明该算法在相比于已有的量子分类算法具有更强大分类能力的同时,还大幅减少了网络参数,降低了训练代价。
6、C-Watcher:一个新冠肺炎高风险小区预警框架
C-Watcher:AFrameworkforEarlyDetectionofHigh-RiskNeighborhoodsAheadofCOVID-19Outbreak
7、群体感知的多任务出行需求预测
Community-AwareMulti-TaskTransportationDemandPrediction
8、一种基于用户出行意图建模的异地POI推荐方法
Out-of-TownRecommendationwithTravelIntentionModeling
9、高阶张量的盲块对角化分解
ABlindBlockTermDecompositionofHigherOrderTensors
张量是高维数据的天然表示方法,张量分解是分析高维数据的重要工具。当前,张量分解已被成功应用于信号处理、数据挖掘、机器学习等领域。特别地,在盲源信号分离问题中,人们通过计算观测信号的高阶统计量(例如四阶累积量)——一个高阶张量的张量分解,可以分离出源信号。然而,目前计算这种张量分解的方法要求知道相互独立源信号组的个数,以及每组源信号的大小。并且,即使在已知上述信息的条件下,现有方法常常不能收敛,并且抗噪性较差。本文所提出的高阶张量的盲块对角化分解方法成功解决了上述问题。张量的盲块对角化分解是一种通用工具,希望其能在更多场景中获得成功应用,特别是在信号处理与自动聚类中。
10、基于特征融合的两阶段深度信息补全
FCFR-Net:FeatureFusionbasedCoarse-to-FineResidualLearningforMonocularDepthCompletion
深度信息补全的目标是以稀疏的深度信息及对应的彩色信息作为输入,恢复更加密集准确的场景深度信息。现有的方法主要把深度信息补全视为单阶段的问题,在这些方法中,特征提取和融合的不够充分,因此限制了方法的性能。为此,本文提出了一个两阶段的残差学习框架,包括sparse-to-coarse阶段和coarse-to-fine阶段。在sparse-to-coarse阶段,以稀疏的深度信息和对应的彩色信息为输入,本文使用一个简单的CNN网络对稀疏的深度信息进行粗略的填充获得场景密集的深度信息;在coarse-to-fine阶段,以sparse-to-coarse阶段的结果和对应的彩色信息为输入,本文使用通道融合策略和能量融合策略提取获得更加有效的特征信息,因此可以获得更优的场景密集深度信息。本文方法在目前的KITTIdepthcompletionbenchmark中排名第二,同时在室内和室外数据集的测试也证明了我们所提方法的先进性。
11、模拟未标注数据分布用于单标注的医疗图像分割
ModelingtheProbabilisticDistributionofUnlabeledDataforOne-shotMedicalImageSegmentation
现有的医疗图像分割网络往往需要大量的有标注的数据才能取得比较好的分割结果。然而3D医疗图像的分割标注需要大量的专业知识和人力成本。因此本文提出一种数据增广的方法,即只利用一张有标注的图片和一些未标注的图片就可以生成大量的真实、多样且有标注的训练数据。本文首先通过图像配准来学习有标注图片到无标注图片之间形状和亮度的真实变换。其次通过VAE网络来学习这些真实变换的分布,并由此生成多样且真实的变换。最后将这些生成的变换作用到有标注图片上生成多样的有标注的图片,并用于分割网络训练。在两个单标注的医疗图像分割数据集上,本文方法超过了SOTA,且实验表明该方法具有更好的泛化能力。
12、TRQ:基于残差量化的三值神经网络
TRQ:TernaryNeuralNetworksWithResidualQuantization
本文认为通过简单的阈值操作进行三值量化导致了较大的精度损失,因而提出一种基于基—残差框架的低误差量化器。该量化器区别于普通阈值操作,通过从全精度权重中提取基与残差信息并结合得到重构三值权重,同时通过递归量化来精细化残差,可以在量化过程中为卷积核保留更多的信息,用以降低量化误差及准确度损失。本文的方法是通用的,可以通过递归地编码残差拓展到多bit量化上。大量的实验数据证明本文提出的方法可以在网络加速下得到较高的识别精度。