视觉目标跟踪漫谈:从原理到应用

丰富的线上&线下活动,深入探索云世界

做任务,得社区积分和周边

最真实的开发者用云体验

让每位学生受益于普惠算力

让创作激发创新

资深技术专家手把手带教

遇见技术追梦人

技术交流,直击现场

海量开发者使用工具、手册,免费下载

极速、全面、稳定、安全的开源镜像

开发手册、白皮书、案例集等实战精华

为开发者定制的Chrome浏览器插件

在计算机视觉领域中并没有对视觉目标跟踪(简称跟踪,下同)的唯一定义。通常来说,跟踪的目标是视频帧或图像中的某个区域或物体,不需要其语义信息(类别等),此概念被形象地描述为“万物跟踪”。同时,也存在一些特例,通常被应用在一些特定场景中对已知类型物体的跟踪,例如工厂流水线监控中对某些特定产品的跟踪(如零部件等)。

很多学者对跟踪有着不同的阐释,包括:“跟踪是视频序列中识别感兴趣区域(regionofinterest)的过程”[1],或者“给定目标在视频中某一帧的状态(位置、尺寸等),跟踪是估计(estimate)该目标在后续帧中的状态”[2]等。这些定义看似大相径庭,但其实有很多共同点。通过提取这些共同点,我们将跟踪问题定义为:跟踪是在一个视频的后续帧中找到在当前帧中定义的感兴趣物体(objectofinterest)的过程。

图1.博尔特参加男子百米短跑的视频截图[3]

假设在视频上一帧我们找到了博尔特所在的位置,我们要做的是在当前帧中继续找到博尔特所在的位置。如前所述,视觉是跟踪问题(视觉目标跟踪)的限定条件,其带来了可以利用的性质。在这里,我们可以利用的defactorules是:在同一段视频中,相同的物体在前后两帧中的尺寸和空间位置不会发生巨大的变化[4]。比如我们可以做出如下判断:博尔特在当前帧中的空间位置大概率会在跑道中,而几乎不可能在旁边的草坪内。也就是说,如果我们想知道博尔特在当前帧中的空间位置,我们只需要在跑道中生成一些候选位置,然后在其中进行寻找即可。上述过程引出了跟踪中一个重要的子问题,即candidategeneration,通常被表述为候选框生成。

博尔特就是图像中个子最高,并且穿着黄色和绿色比赛服的人。但是,我们忽略了一个问题,就是我们对于博尔特的“定义”其实已经包含了很多高度抽象的信息,例如个子最高,还有黄色和绿色的比赛服。在计算机视觉领域中,我们通常将这些高度抽象的信息称之为特征。对于计算机而言,如果没有特征,博尔特和草坪、跑道、或者图像中其他对于人类有意义的物体没有任何区别。因此,想让计算机对博尔特进行跟踪,特征表达/提取(featurerepresentation/extraction)是非常重要的一环,也是跟踪中第二个重要的子问题。

在上述三个小节中我们分别介绍了跟踪基本原理中的三个子问题:候选框生成、特征表达/提取、及决策。需要注意的是,这三个子问题并非彼此独立。有时候,决策问题的解决方案会包含更为精确的候选框生成和/或更为抽象的特征提取,利用端到端(end-to-end)的思想解决跟踪问题,来提高跟踪系统和算法的性能。这在近几年流行的基于深度学习的跟踪算法中非常常见[1]。

从某种意义来说,在回答“视觉目标跟踪有哪些应用”的问题之前,我们应该先讨论学术研究方法论中“为什么”的问题,即“为什么要做视觉目标跟踪”。

跟踪在计算机视觉科学的经典应用领域,包括安防领域(车辆跟踪、车牌识别等)、监控领域(人脸识别、步态识别等)、巡检领域(无人机追踪、机器人导航等)、以及新兴的智慧生活(人机交互、VR/AR等)、智慧城市(流量监测等)、以及智慧工业(远程医疗等)等。跟踪问题的主要应用可以总结为:跟踪主要应用于对视频或连续有语义关联的图像中任意目标的空间位置、形状和尺寸的获知。

作为检测算法的补充,其可以在视频或连续有语义关联的图像中提供目标的空间位置,降低整个系统的复杂度(例如检测仅应用于视频第一帧识别出目标,以及后续帧中的某些帧来确定目标位置,然后在其余帧中应用跟踪确定目标位置)。

候选框生成、特征表达/提取、和决策构成了一条完整的逻辑链路。具体来说,对于视频中的每一帧(通常不包括第一帧),跟踪的系统流程可以用图3中的架构来表示:

图3.视觉跟踪系统架构[4,有改动]

如图所示,在跟踪系统中,上一帧(含跟踪结果,如图中inputframe)和当前帧会被作为系统输入,然后分别经过运动模型(motionmodel)、特征模型(featuremodel)、和观测模型(observationmodel),最终作为当前帧对目标位置的预测(finalprediction)输出。其中,候选框生成、特征表达/提取、和决策三个子问题分别在上述三个模型中被解决,其输入与输出的对应关系如表1。

表1.视觉跟踪系统架构中各模型的输入与输出

注意,图3中的跟踪系统架构应用了假设检验(hypothesistesting)模型。该模型是统计推断中的常用方法,其基本原理是先对系统的特征做出某种假设,然后通过研究抽样的统计分布,判断应该接受还是拒绝此假设。该模型能够很好地应用于跟踪问题,即假设当前帧的某个候选框是预测目标,然后通过特征表达/提取和决策,来判断该候选框是否可以作为当前帧目标位置的合理预测。

图4.视觉跟踪目标常用表达方式[5]

如图所示,目标可以被矩形框(4c)、骨架(4f)、或轮廓(4h)等不同形式所表达。其中,广泛被计算机视觉研究中所采用的是如4(c)中的矩形框(即boundingbox,一译包围盒)表达。这种表达形式的优点包括易生成(如最小外接矩形)、易表达(如左上角+右下角坐标,或中心点坐标+宽高)、易评估(如IOU(intersectionoverunion),一译交并比)等。详细的信息见[5]。

推理过程:即图3中的系统流程,用于预测当前帧的目标位置,任何跟踪算法都需要。在该过程中,运动模型生成候选框,然后经过特征模型进行特征表达/提取,将含有特征的候选框输入观测模型进行决策(对目标位置的预测)。如视觉目标跟踪的定义一节所述,defactorules是在同一段视频中,相同的目标在前后两帧中的尺寸和空间位置不会发生巨大的变化。基于此,我们可以大大减少候选框的数量和种类,即我们只需要在上一帧预测的目标位置附近生成和其尺寸近似的候选框,从而提高整个跟踪系统的效率。

训练过程:通常在基于判别式方法的跟踪算法中需要,属于跟踪系统学习如何区分目标和非目标的过程,将在视觉目标跟踪的算法分类一节中详述。在该过程中,所谓的候选框生成应该被称作“正负样本生成”。在这里,正样本可以近似地理解为目标,负样本可以近似地理解为非目标的干扰项,例如背景或其他像目标但不是目标的物体。为了提高该类算法的跟踪系统对于正负样本的判别能力,在生成负样本时通常会在整个图像中寻找,而不仅限于上一帧预测的目标位置附近。

总结来说,候选框生成被应用在推理过程,用来生成当前帧目标的潜在位置;正负样本生成被应用在基于判别式方法的跟踪算法的训练过程,用来生成正负样本训练跟踪系统,使得系统习得区分目标与分目标的能力。

图5示出了运动模型的系统架构以及如何得到候选框的方法分类。如图所示,前一帧(第n帧)中预测目标的位置被输入模型中,输出当前帧(第n+1帧)的候选框。这些候选框可能有位置变化、尺度变化、和旋转等,如图中绿色和橙色虚线框所示。

图5.运动模型系统架构与分类

通过仿射变换生成候选框。具体来说,假设输入的上一帧预测目标的位置矩形框坐标为x、仿射变换的参数矩阵为A、以及输出的(一个)候选框的坐标为y,则

y=Ax

其中,A中的参数包括候选框位置变换、尺度变换、旋转变换、和长宽比变换等信息,仿射变换的示例如图5所示。这里,概率体现在上述参数都是符合某种概率分布(通常是高斯分布)的随机变量,而采样则体现在生成不同数量的候选框。

如图6所示,以某个形状和大小的结构元素(形象地被称之为窗)在当前帧中按一定的空间间隔移动,每次移动后覆盖的图像中的相应像素即为生成的候选框。通常来说,通过此种方法生成的候选框和前一帧的矩形框相比仅有位置变换,其他变化(如旋转变换)需要进行额外的处理。

图6.划窗生成候选框示例

图7.循环移位生成候选框示例[6]

对于人类来说,图像特征是对于图像的直观感受。对于计算机来说,图像特征是图像内的一些区域/整个图像和其他区域/其他图像的差异。常用的图像特征包括颜色特征、形状特征、空间特征、纹理特征、以及在深度学习中通过卷积神经网络得到的深度特征等。博尔特的黄色和绿色的比赛服即属于颜色特征,而个子高则结合了空间特征和纹理特征。通常来说,特征越“深”(抽象且不直观的的特征,如深度特征),对目标的判别能力越好;反之,特征越“浅”(具体且直观的特征,如颜色等),对目标的空间位置信息保留越好。因此,特征表达/提取通常需要在两者之间做权衡,才能达到更好的跟踪效果。

了解什么是图像特征之后,特征表达/提取要解决的问题是如何来描述这些特征,即用计算机能够理解的语言来描述这些特征的数学特性的一个或多个维度。常用的特征表达/提取方法包括朴素方法(naive,如像素值)、统计方法(statistics,如直方图)、和变换(transformation,如像素值的梯度)等。

特征和特征表达被统称为特征模型。特征模型可以对从运动模型中得到的候选框进行分析,得到相应的候选框特征表达/提取,如图8所示。

图8.特征模型=特征+表达/提取

图9示出了如何得到对特征进行表达/提取的方法分类。可以看到的是,在应用卷积神经网络(CNN)得到深度特征(deep)之前,手工的(hand-crafted)特征表达/提取方法是跟踪问题中对于图像特征进行处理的主流方法,其包括上述提到的各种特征和表达方式。在诸多特征和表达方式中,应用最多的是颜色特征和梯度直方图。颜色特征比较容易理解,其不仅符合人类对于图像的直观理解,同时也是最简单的计算机表征图像的方法,即像素值。梯度直方图是关于梯度的直方图,其中梯度是图像像素值在某个特定空间方向上的变化,例如水平相邻像素之间的像素值差;而直方图是一种常用的数据分布的图像表示,可以直观地表示出一组数据在其取值范围内的数量变化。请各位同学参考[7]获取更多关于图像特征的信息。目前,基于深度学习的方法逐渐成为跟踪问题研究的主流,其通过卷积神经网络(CNN)得到的深度特征(deep)极大地提高了跟踪算法对目标的判别能力,所达到的性能也超过应用手工特征的跟踪算法。

**图9.特征与特征表达/提取方法的分类**

在观测模型中,如何在诸多候选框中选出一个作为我们对目标位置在当前帧的预测是在观测模型需要解决的主要问题,即做决策(“哪一个”)。直观理解,我们只需要在当前帧的候选框中找出最“像”前一帧的预测目标的候选框就可以,然而最“像”并不是仅有一种定义。

通常来说,在计算机视觉领域中解决最“像”问题可以被归类为匹配问题,即在候选框中找到和前一帧目标最为匹配的那个。匹配问题是整个跟踪问题的核心,也是绝大多数跟踪算法解决的主要的问题,其解决方案的效果直接影响整个跟踪算法的性能。有时候,即使在候选框生成和特征表达/提取方面做得不够好,例如候选框的形状和尺寸与实际有出入,或提取的特征的判别程度不高,优秀的匹配算法也可以在一定程度上弥补前两个模型中存在的不足,维持跟踪算法的整体性能。

前述中提到的最“像”或匹配问题在本质上是一个相似度度量(similaritymeasurement)问题。在解决相似度问题的时候,我们需要一个衡量机制,来计算两个相比较的个体的相似度。在跟踪问题中,被比较的个体通常是候选框和前一帧的预测结果(或者是groundtruth),而衡量机制可以被抽象成距离(distance)。这里的距离不仅仅是空间距离,即框与框之间在图像中相隔多少个像素,还包括两个概率分布的距离。

由于空间距离相对好理解,我们在这里仅对概率分布距离稍作解释:每一帧的跟踪结果是一个预测值,即每一个候选框是目标的概率。如果综合所有候选框,就可以构成一个概率分布。从概率分布的角度理解匹配问题,跟踪问题就转换成在当前帧寻找和上一帧的候选框概率分布“最接近”的一组候选框分布,该“最接近”即是概率分布距离。常用的空间距离有Minkowskidistance(Manhattandistance和Euclideandistance是其特殊情况),常用的概率分布距离有Kullback–Leibler(KL)散度、Bhattacharyyadistance、交叉熵、以及Wassersteindistance等。参考[8]。

图10示出了观测模型的系统架构。如图所示,前一帧(第n帧)中预测的目标位置、当前帧(第n+1帧)的候选框、和候选框的特征被输入模型,输出当前帧(第n+1帧)的预测结果(目标位置)。这些候选框可能有位置变化、尺度变化、和旋转等,如图中绿色和橙色虚线框所示。

图10.观测模型系统架构

图11示出了观测模型的模块拆解和分类。如图所示,观测模型的核心模块是匹配(match)。对于匹配方法的分类,业界的主流观点是:生成式方法(generative)和判别式方法(discriminative)[1,2,4,9]。这两种方法的主要区别在于是否有背景信息的引入。具体来说,生成式方法使用数学工具拟合目标的图像域特征,并在当前帧寻找拟合结果最佳(通常是拟合后重建误差最小的)的候选框。而判别式方法则是不同的思路,其将目标视为前景,将不包含目标的区域视为背景,从而将匹配问题转换成了将目标从背景中分离的问题。

对比起来,判别式方法具有更好的判别能力,即将目标和其他干扰项区分开的能力,这也是这一类匹配方法得名的由来。作为上述观点的论据支撑,应用判别式方法的跟踪算法的性能已经大幅度超越应用生成式方法的跟踪算法,成为学术界研究的主流方向[9]。总结来说,生成式方法把跟踪问题建模成拟合或多分类问题,而判别式方法把跟踪问题定义为二分类问题。

图11.观测模型的模块拆解和分类

此外,在图11中我们注意到还有两个虚线框示出的模块,分别代表特征表达/提取(featurerepresentation/extraction)和更新(update)。在这里,虚线表示这两个步骤不是必须被执行的。对于有的算法而言,通过特征模型得到的特征会被进一步抽象,来获取目标更深层次的特征信息,然后再被送进匹配模块执行匹配算法。同时,更新的步骤也非必须的,其存在的意义是获得更为准确的预测结果。

具体来说,匹配算法得到了一系列的参数,应用这些参数即可对当前帧的目标位置进行预测。如果在后续所有帧的预测过程中都应用这些参数,可能会出现的结果是预测趋向不准确,最终导致跟踪的失败。其可能的原因包括累积误差、外因(如遮挡、光照变化)、以及内因(如目标外观变化、快速运动)等。如果引入更新模块,在每若干帧之后根据之前的预测结果更新匹配算法的参数,则可以减小误差,提高跟踪的准确性。

跟踪算法根据其观测模型被分为两大类:生成式方法(generative)和判别式方法(discriminative)。值得注意的是,在这里我们强调分类的依据是观测模型,是为了将整个跟踪系统架构中的不同模型解耦合。具体来说,即使两个算法分别应用了生成式方法和判别式方法作为相似度匹配的解决方案,其可能都应用了相同的特征,例如颜色直方图。如果我们将应用在跟踪算法中的特征作为分类的依据,这两个算法应该被归为一类。很显然,这是另一种算法分类的角度,但是却存在将两个大相径庭的算法归为一类的可能性。

在明确了我们分类的前提之后,图12示出了我们对于跟踪算法的分类以及各分类下的一些经典算法。值得注意的是,在这里我们仅将分类细化到第二层,即将生成式和判别式做进一步分类。根据不同算法的具体细节,图中的分类可以继续深化,但是这有别于此文的宗旨,即对跟踪问题的系统性的概括。

图12.跟踪算法根据观测模型的分类和举例

关于生成式方法,其核心思想即衡量前一帧的预测目标与当前帧候选框的相似度,然后选择最为相似的候选框作为当前帧的跟踪结果(即预测目标在当前帧的位置)。生成式方法被进一步分成下述三类:

即用空间距离衡量相似度的解决方案,通常利用最优化理论将跟踪问题转换成空间距离最小化问题。利用此方法的经典算法包括IVT(IncrementallearningVisualTracking)[10]和ASLA(AdaptiveStructuralLocalsparseAppearancemodeltracking)[11]。其算法的核心思想是:计算当前帧候选框的像素灰度值与上一帧预测目标的像素灰度值之间的Euclideandistance,然后取距离最小的候选框作为当前帧的预测目标。在特征提取时应用了奇异值分解等技术来减小计算复杂度。

即用概率分布距离衡量相似度的解决方案,通常利用最优化理论将跟踪问题转换成概率分布距离最小化问题。利用此方法的经典算法包括CBP(Color-BasedProbabilistic)[12]和FRAG(robustFRAGments-based)[13]。其算法的核心思想是:计算当前帧候选框的颜色直方图分布与上一帧预测目标的颜色直方图分布之间的Bhattacharyyadistance,然后取距离最小的候选框作为当前帧的预测目标。

这部分解决方案以MeanShift[14]和CamShift算法为代表,其模糊了对于相似度匹配的距离衡量,甚至没有显式地候选框生成过程,而是借鉴了机器学习中meanshift聚类算法的思想,在每一帧中利用上一帧预测目标的颜色直方图分布,计算该帧中相应位置的像素的颜色直方图分布,然后进行聚类得到其分布的均值,其对应的像素位置是该帧中预测目标的中心位置,然后加上候选框宽高等信息即可得到当前帧预测目标的空间位置。在MeanShift算法中,宽高信息是固定的,因此其无法应对目标尺度和旋转变化,而CamShift通过将图像矩引入相似度匹配[7],得到目标尺度和旋转信息,进一步提高了算法的性能。

应用机器学习算法的思想将目标作为前景从背景中提取出来的方法。利用此方法的经典算法包括STRUCK(STRUCturedoutputtrackingwithKernels)[15]和Tracking-Learning-Detection(TLD)[16]。STRUCK和TLD算法分别采用经典机器学习算法中的支持向量机(supportvectormachine)和集成学习(ensemblelearning)进行分类,并采取了一系列优化方法来提高算法的性能。

上述提到的应用深度学习算法的思想将目标作为前景从背景中提取出来的方法。

更多优秀的跟踪算法参见[1,2,4,5,9,23]。我们将上述提到的算法总结在表2中,包括了被应用在这些算法中的运动模型、特征模型、和观测模型。表2体现了我们对整个跟踪系统架构中的不同模型的解耦合。通过表2我们可以清晰地了解每个算法在不同模型中应用了哪些方法,这有助于我们从不同的角度对算法进行分类,提炼同类算法中的共同点,以及对不同类算法进行有效地区分和对比。

表2.跟踪算法总结

下图展示了[17]对于跟踪算法的总结:

图13.跟踪算法总结[24]

在跟踪问题中,也有类似的定义。跟踪系统和算法广泛应用矩形框(boundingbox)的原因之一就是易评估,其评估的核心就是交并比,即IOU(intersectionoverunion)。IOU有如下定义:

较大的IOU值从一定程度上反应了两个进行比较的矩形框贴合程度较高。如果我们用预测目标的矩形框和groundtruth的矩形框计算IOU,我们就可以知道跟踪算法的效果:IOU越大,表示跟踪的效果越好。

VOT(visualobjecttracking)竞赛中从2013年开始举办,目前已经发展成评估跟踪算法的主流标准,VOT中比较重要的两个指标是accuracy和robustness。实际上,竞赛中采用的第一指标是EAO,即expectedaccuracyoverlap,是对accuracy的一种加权求和,其本质仍然是accuracy。Accuracy有如下定义:

即计算每一帧预测目标的矩形框与groundtruth的矩形框之间的IOU,然后对所有帧求和再做平均。其中N是总帧数,可以是一段视频的总帧数,也可以是多段视频,或者多段视频重复测试多次。Robustness有如下定义:

即跟踪失败的帧数与总帧数的比值,其中跟踪失败定义为当前帧预测目标的矩形框与groundtruth的矩形框的IOU为0。

上述两个指标从两个方面体现了跟踪算法的性能:accuracy体现了当跟踪成功时,算法的精确度有多高,即找准目标的位置的概率,侧重算法的精确性;robustness则体现了算法找到目标位置的概率,侧重算法的鲁棒性。有了这两个指标,不同的算法就可以在同一套衡量标准下进行比较。

除了评估指标以外,另一个对于跟踪算法评估非常重要的部分就是数据集。VOT竞赛不仅提供了评估指标,其本身的数据集也是评估跟踪算法的一个权威的数据集。除此之外,常用的评估数据集还包括OTB[2]、UAV123[18]、以及GOT-10K[19]等。不同的数据集对于评估指标有着不同的定义,但是其思想都和评估指标一节中提到的accuracy和robustness有着一定的共同点:即全面考虑算法的精确性和鲁棒性。

除了不同的评估指标,不同的数据集之间通常也有共同点,同时也是衡量一个数据集是否适合作为评估数据集的标准:视频数量充足、目标类别丰富、以及标注信息准确。如果没有充足的视频和足够丰富的目标类别,算法的性能很容易发生过拟合,即在少量的视频和/或类别中表现很好,但是在其他视频和/或类别中表现欠佳,因此无法准确地衡量出算法的真实性能。标注信息的准确性则不言而喻,它直接影响到评估的正确性。对于其他类型的数据集,例如作为训练算法使用的数据集,包括ImageNet[20]、COCO[21]等,如果能够满足上述条件,也可以拓展成为评估数据集。

我们以最新的2019年VOT竞赛(VOTchallenge2019)作为跟踪算法评估的示例。表3展示了竞赛的节选结果[9]。通用的竞赛流程是:竞赛组委会开放报名通道,参赛者可以通过该通道提交算法代码,然后组委会统一收集代码,再评估数据集上进行测试,最后将竞赛结果以报告或白皮书的形式公布。

表3.VOTchallenge2019结果节选

表3中的体现了参赛算法在该年的评估数据集上取得的结果,包括了EAO、accuracy、和robustness等指标。通常,竞赛结果是依据EAO进行排名的,不过结果中也会标注各单项指标的前三名,如表3中用圆圈标记的数字。

目前,基于深度学习的算法逐渐成为视觉目标跟踪研究的主流。除了文中介绍的算法之外,无监督学习、元学习(metalearning)、和其他人工智能领域的前沿算法也被引入视觉目标跟踪的学术研究。此外,基于深度学习的视觉目标跟踪算法也逐渐被应用在工业界,通过包括模型压缩在内的优化方法有效地降低其算法复杂度,从而达到并超越目前适合于实际计算机视觉应用的跟踪算法的性能。

[1]Fiaz,Mustansar,etal."Handcraftedanddeeptrackers:Recentvisualobjecttrackingapproachesandtrends."ACMComputingSurveys(CSUR)52.2(2019):1-44.

[2]Wu,Yi,JongwooLim,andMing-HsuanYang."Objecttrackingbenchmark."IEEETransactionsonPatternAnalysisandMachineIntelligence37.9(2015):1834-1848.

[4]Wang,Naiyan,etal."Understandinganddiagnosingvisualtrackingsystems."ProceedingsoftheIEEEinternationalconferenceoncomputervision.2015.

[5]Yilmaz,Alper,OmarJaved,andMubarakShah."Objecttracking:Asurvey."ACMcomputingsurveys(CSUR)38.4(2006):13-es.

[6]Henriques,JooF.,etal."High-speedtrackingwithkernelizedcorrelationfilters."IEEEtransactionsonpatternanalysisandmachineintelligence37.3(2014):583-596.

[7]Gonzalez,RafaelC.,RichardE.Woods,andStevenL.Eddins.DigitalimageprocessingusingMATLAB.PearsonEducationIndia,2004.

[8]Goodfellow,Ian,YoshuaBengio,andAaronCourville.Deeplearning.MITPress,2016.

[9]Li,Xi,etal."Asurveyofappearancemodelsinvisualobjecttracking."ACMtransactionsonIntelligentSystemsandTechnology(TIST)4.4(2013):1-48.

[10]Ross,DavidA.,etal."Incrementallearningforrobustvisualtracking."Internationaljournalofcomputervision77.1-3(2008):125-141.

[11]Jia,Xu,HuchuanLu,andMing-HsuanYang."Visualtrackingviaadaptivestructurallocalsparseappearancemodel."2012IEEEConferenceoncomputervisionandpatternrecognition.IEEE,2012.

[12]Pérez,Patrick,etal."Color-basedprobabilistictracking."EuropeanConferenceonComputerVision.Springer,Berlin,Heidelberg,2002.

[13]Adam,Amit,EhudRivlin,andIlanShimshoni."Robustfragments-basedtrackingusingtheintegralhistogram."2006IEEEComputersocietyconferenceoncomputervisionandpatternrecognition(CVPR'06).Vol.1.IEEE,2006.

[14]Comaniciu,Dorin,VisvanathanRamesh,andPeterMeer."Kernel-basedobjecttracking."IEEETransactionsonpatternanalysisandmachineintelligence25.5(2003):564-577.

[15]Hare,Sam,etal."Struck:Structuredoutputtrackingwithkernels."IEEEtransactionsonpatternanalysisandmachineintelligence38.10(2015):2096-2109.

[16]Kalal,Zdenek,KrystianMikolajczyk,andJiriMatas."Tracking-learning-detection."IEEEtransactionsonpatternanalysisandmachineintelligence34.7(2011):1409-1422.

[18]Mueller,Matthias,NeilSmith,andBernardGhanem."Abenchmarkandsimulatorforuavtracking."Europeanconferenceoncomputervision.Springer,Cham,2016.

[19]Huang,Lianghua,XinZhao,andKaiqiHuang."Got-10k:Alargehigh-diversitybenchmarkforgenericobjecttrackinginthewild."IEEETransactionsonPatternAnalysisandMachineIntelligence(2019).

[20]Russakovsky,Olga,etal."Imagenetlargescalevisualrecognitionchallenge."Internationaljournalofcomputervision115.3(2015):211-252.

[21]Lin,Tsung-Yi,etal."Microsoftcoco:Commonobjectsincontext."Europeanconferenceoncomputervision.Springer,Cham,2014.

THE END
1.面试总结,十大数据预处理方法!数据预处理方法的重要性在于它能够清洗和转换原始数据,使其适合用于机器学习模型训练。有效的预处理可以帮助去除噪声、处理缺失值和异常数据,提升模型的准确性和稳定性。 此外,合适的预处理还能减少模型过拟合的风险,增强模型的泛化能力。 今儿总结的十个方面的数据预处理方法,https://mp.weixin.qq.com/s?__biz=MjM5NzEyMzg4MA==&mid=2649508484&idx=4&sn=34a64015791748ac0f28fee2e107bcec&chksm=bf1edcfc1d0bc191805601740b1706942b62a12c8955315a78069a1dc61e7ec4d7138b0837ea&scene=27
2.数据挖掘七种常用的方法汇总腾讯云开发者社区聚类分群效果可以用向量数据之间的相似度来衡量,向量数据之间的相似度定义为两个向量之间的距离(实时向量数据与聚类中心向量数据),距离越近则相似度越大,即该实时向量数据归为某个聚类。 数据挖掘方法 利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它https://cloud.tencent.com/developer/article/1892597
3.数据挖掘的四种基本方法数据挖掘的四种基本方法 东奥美国注册管理会计师 2024-12-06 14:51:12 遗传算法 遗传算法是一种依据微生物自然选择学说与基因遗传原理的恣意优化算法,是一种仿生技能全局性提升办法。遗传算法具有的暗含并行性、便于和其他实体模型交融等特性促使它在数据发掘中被多方面运用。https://www.dongao.com/cma/zy/202406204447292.html
4.16种数据挖掘技术预测是数据挖掘的一个非常强大的方面,它代表了分析的四个分支之一。预测分析使用在当前或历史数据中发现的模式来将其扩展到未来。因此,它使组织能够洞察其数据中的下一个趋势。使用预测分析有几种不同的方法。一些更先进的涉及机器学习和人工智能的方面。然而,预测分析并不一定依赖于这些技术——它也可以用更直接https://baijiahao.baidu.com/s?id=1786242884956031097&wfr=spider&for=pc
5.数据挖掘的几种方法有哪些帆软数字化转型知识库数据挖掘的方法包括分类、聚类、回归、关联规则、序列模式、异常检测和降维技术等。其中,分类是一种常见且重要的数据挖掘方法,通过对数据进行标记,帮助识别数据所属的类别。分类算法包括决策树、支持向量机和神经网络等。分类算法的核心在于通过训练集来生成分类模型,再用这个模型对新数据进行分类。比如在电子邮件分类中,https://www.fanruan.com/blog/article/594745/
6.三种常见的数据挖掘方法有刷刷题APP(shuashuati.com)是专业的大学生刷题搜题拍题答疑工具,刷刷题提供三种常见的数据挖掘方法有___、___、___的答案解析,刷刷题为用户提供专业的考试题库练习。一分钟将考试题Word文档/Excel文档/PDF文档转化为在线题库,制作自己的电子错题本,提高学https://www.shuashuati.com/ti/e957af7720234200a5f3642f5f4ef282.html?fm=bdded973fbd04bb56579e77a2b97eb0092
7.数据挖掘消除噪音的三种方法数据挖掘噪声数据挖掘消除噪音的三种方法 数据挖掘噪声 [b]数据挖掘:[/b] 从数据中获取知识,辅助科学决策。 可以发掘埋藏在海量数据中有价值的信息。 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又有潜在有用信息和知识的过程。https://blog.51cto.com/u_16099341/9134248
8.使用代理IP的三种方法通过代理IP服务商,就可以从后台登录账号获取免费代理ip,生成API接口,连接后就可以调用API接口来提取IP,这种方法大多用于网络爬虫,数据挖掘等等业务,相关工作者会根据业务需求来编写代码以此实现IP切换。切换的方式有很多种,一种是通过API接口获取代理IP,然后通过代码控制切换代理IP。 https://www.iphai.cn/info/1295.html
9.故障诊断方法有哪三种CAN故障诊断方法介绍故障诊断方法有哪三种 CAN故障诊断方法介绍 描述 目前国内商用汽车普遍采用J1939通信协议构架CAN通信网络。CAN总线发生故障时,如何高效地查找故障原因,一直是困扰维修工一大难题。 本文以欧曼GTL超能版重卡为例,就CAN线开路和短路故障给出了排查方案,相信会对广大维修工有所帮助。欧曼GTL超能版重卡CAN网络拓扑结构如下图https://m.elecfans.com/article/2204252.html
10.三种差异分析的整理针对测序数据和芯片数据,目前常用差异分析的R包有edgeR、limma、DESeq2,做一简单比较,方便平时分析。内容多为搬运,主要方便下次寻找。 1. 三种分析方法的比较 三种分析比较 image.png 三种packages的比较 1.limma包做差异分析要求数据满足正态分布或近似正态分布,如基因芯片、TPM格式的高通量测序数据。 https://www.jianshu.com/p/cd1b38215f8a
11.企业网站推广方案推荐5篇2、数据挖掘。数据挖掘是一个很不错的方法,这个方法主要是企业线下积累的一些东西,每个企业都应该有企业策划人员,长年下来会累积各种各样的新闻文章和产品知识文章,笔者就见过这样的,然后把积累的内容放在线上的网站里,很值得一试。 3、无版权内容。无版权内容可能会有站长们想问什么是无版权内容,一般来说作者死了https://www.liuxue86.com/a/4880489.html
12.科学网—基于人工智能和被动微波遥感同时反演土壤水分和地表温度如何将这三种方法统一起来,这是我读研究生以来一直在思考的问题。这里以被动微波反演地表温度和土壤水分为例来说明。我(毛克彪)2001年在南京大学计算机系周志华教授数据挖掘课堂上学习神经网络时,我就认为神经网络就是一个高级的优化算法,如果简单地采集数据,输入数据和输出数据之间没有明确的物理数学关系,那么这时的神经https://blog.sciencenet.cn/blog-67260-1383024.html
13.数据挖掘的常用方法有哪些?从大规模的文本数据中提取有用的信息和知识,例如主题提取、情感分析等。分析和挖掘复杂的网络结构中的https://www.zhihu.com/question/619824565
14.数据挖掘的常用方法都有哪些?在数据分析中,数据挖掘工作是一个十分重要的工作,可以说,数据挖掘工作占据数据分析工作的时间将近一半,由此可见数据挖掘的重要性,要想做好数据挖掘工作需要掌握一些方法,那么数据挖掘的常用方法都有哪些呢?下面就由小编为大家解答一下这个问题。 首先给大家说一下神经网络方法。神经网络是模拟人类的形象直觉思维,在生物http://api.cda.cn/view/26507.html
15.数据挖掘与分析的六种经典方法论最近梳理了一下数据挖掘与分析的常用方法论,这里简要介绍6种模型。 1、CRISP-DM 模型 CRISP-DM是CrossIndustry Standard Process for Data Mining(跨行业数据挖掘标准流程)的字母缩写。CRISP-DM是由一家欧洲财团(时称SIG组织)在20世纪90年代中后期提出来的,是一套用于开放的数据挖掘项目的标准化方法,也是业内公认https://www.niaogebiji.com/article-30475-1.html
16.浅析数据挖掘的四种基本方法浅析数据挖掘的四种基本方法 我们生活在大数据时代,当今的互联网已经发展到大数据时代了,如今的信息技术从数据处理向数据分析和理解的方向一直在转变,如今企业都在不断的收集各种数据,从大数据中挖掘有用的数据信息,数据挖掘出有价值的数据。现在数据挖掘技术已经成为企业不可缺少的技术,需要收集海量的数据,从海量数据中https://www.kkidc.com/about/detail/hcid/196/id/1857.html
17.利用数据挖掘的知识挖掘方法?Worktile社区总结:通过对数据挖掘的概念、技术分类、常用算法和应用案例等内容的介绍,可以了解数据挖掘在各个领域中的重要作用,以及其面临的挑战和发展趋势。同时,了解数据挖掘的基本流程和方法,有助于更好地应用于实际问题中。数据挖掘作为一门重要的数据分析技术,将在未来的发展中发挥越来越大的作用,为人们的生活和工作带来更多https://worktile.com/kb/ask/85519.html
18.成都永陵博物馆数字化建设规划方案(摘要)数据挖掘是从大量的数据中抽取出潜在的、有价值的知识(模型或规则)的过程。当今世界上发达国家的“计算机辅助信息管理系统”,随着数据仓库技术(DW)和在线分析处理技术(OLAP)的发展,已有过去的单纯的管理型发展到管理决策型。 数据挖掘技术包含以下六种分析方法: https://www.dpm.org.cn/study_detail/100199.html
19.数据挖掘的几种方法理想股票技术论坛数据挖掘是通过使用各种方法和技术来发现、提取和分析大量数据中隐藏的价值信息的过程。常用的数据挖掘方法包括聚类、分类、关联规则挖掘等,而数据挖掘算法则是实现这些方法的具体计算模型和技术手段。在数据挖掘领域,掌握各种数据挖掘方法和技术是进行有效数据分析和决策https://www.55188.com/tag-7077656.html
20.高效实施数据挖掘的方法和步骤yuanye1014有了优秀方法论的指导,还需要一个高效的数据挖掘工具。目前提供数据挖掘产品的厂商非常多,如著名的产品有SAS Enterprise Miner、SPSS Clementine 8.1(简体中文版)、IBM DB2 Intelligent Mine等,这些产品各有特色。 选择一款适合的数据挖掘工具,主要从以下几方面来考虑。下面我们根据CRISP-DM方法论,从数据挖掘项目的各个阶http://blog.chinaunix.net/uid-64814-id-2690182.html