在5岁时,大多数孩子可以识别数字和字母——小字符、大字符、手写、机器打印或旋转——所有这些都很容易被年轻人识别。
在大多数情况下,最好的模式识别器是人类,但我们不了解人类如何识别模式。
模式识别是自动识别数据中的模式和规律。在过去的几十年里,在数据中寻找模式的技术经历了实质性的发展。
本文将介绍什么是模式识别、模式识别的形式,并分析人工智能中模式识别的形式。
模式识别分析传入的数据并尝试识别模式。虽然探索性模式识别旨在识别一般的数据模式,但描述性模式识别开始对检测到的模式进行分类。因此,模式识别处理这两种情况,并根据用例和数据形式应用不同的模式识别方法。
模式识别的数据输入可以是单词或文本、图像或音频文件。因此,与专注于图像识别的计算机视觉相比,模式识别更广泛。
模式的自动和基于机器的识别、描述、分类和分组是各种工程和科学学科中的重要问题,包括生物学、心理学、医学、市场营销、计算机视觉和人工智能。
1985年,SatoshiWatanabe将一种模式定义为“混乱的对立面;它是一个定义模糊的实体,可以命名”。换句话说,模式可以是人们需要识别和识别的任何感兴趣的实体:它足够重要以至于人们想知道它的名称(它的身份)。
因此,模式包括各种形式数据的重复趋势。例如,模式可以是指纹图像、手写草书、人脸或语音信号。模式既可以从物理上观察到,例如在图像和视频中,也可以通过应用统计算法在数学上观察到。
给定一个模式,它的识别和分类可以由以下两个任务之一组成:
识别问题通常作为分类或分类任务提出。这些类要么由设计的系统定义(监督分类),要么基于模式的相似性(在无监督分类中)学习。
在新兴应用程序的推动下,模式识别不断发展,这些应用程序不仅具有挑战性,而且计算量也更大。
因此,模式识别的目标是阐明这些复杂的决策过程机制,并使用计算机使这些功能自动化。
模式识别被定义为研究机器如何观察环境,学会从背景中区分各种感兴趣的模式,并对模式的类别做出逻辑决策。在识别过程中,给定的对象被分配到一个特定的类别。
因为它是一个不断发展和广泛的领域,所以模式识别有几个定义,因为它是一个不断发展和广泛的领域。模式识别的早期定义将其定义为“通过从大量噪声数据中提取重要特征对输入数据进行分类”(1978,ThomasGonzalez)。
另一个定义将模式识别描述为“一门科学学科,其目的是将对象分为许多类别或类。模式识别也是大多数为决策而构建的机器智能系统的组成部分”(2003,SergioTheodoridis)。
一般而言,模式识别可以描述为信息缩减、信息映射或信息标记过程。在计算机科学中,模式识别是指根据属性将已存储在数据库中的信息与传入数据进行匹配的过程。
人工智能(AI)是指对人类智能的模拟,其中机器被编程为像人类一样思考并模仿他们的行为。最突出的是,人工智能领域旨在使机器能够解决复杂的人类识别任务,例如识别人脸或物体。因此,模式识别是人工智能的一个分支。
从历史上看,模式识别的两种主要方法是
第三种主要方法是基于人工神经网络技术,命名为
对于给定的模式识别问题,没有一种技术总是最佳的解决方案。通常认为所有三种或混合方法都可以解决给定的模式识别问题。
接下来,我们将研究用于查找数据模式的最突出方法。
统计模式识别也称为StatPR。在传统的模式识别方法中,早在神经网络方法流行之前,统计方法就得到了最深入的研究和实践。
在统计模式识别中,模式根据其特征进行分组,特征的数量决定了模式如何被视为d维空间中的一个点。这些特征的选择方式是不同的图案占用空间而不重叠。
该方法有效,因此所选属性有助于创建集群。机器按预期学习和适应,然后使用这些模式进行进一步处理和训练。StatPR的目标是选择允许模式向量在d维特征空间中属于不同类别的特征。
SyntacticPatternRecognition,也称为SyntPR,用于识别涉及复杂模式的问题,这些问题可以通过采用分层视角来解决。
因此,句法模式方法依赖于原始子模式(例如字母表中的字母)。该模式是根据基元相互交互的方式来描述的。这种交互的一个例子是它们如何组合成单词和句子。给定的训练样本开发了语法规则是如何开发的,以及句子将如何被“阅读”。
除了分类之外,结构模式识别还提供了如何从原始子模式构建给定模式的描述。因此,该方法已用于模式具有可根据规则集捕获的独特结构的示例,例如心电图波形或纹理图像。
句法方法可能导致要检查的概率的组合爆炸,需要大量的训练集和非常大的计算工作。
模板匹配是最简单和最早的模式识别方法之一。匹配是一种通用操作,用于确定相同类型的两个实体之间的相似性。
因此,模板匹配模型尝试基于参考模板发现样本中的相似性。因此,模板匹配技术通常用于数字图像处理以检测与模板图像匹配的图像的小部分。典型的现实示例是医学图像处理、制造中的质量控制、机器人导航或人脸识别。
最流行和最成功的使用神经网络的机器学习形式是深度学习,它应用深度卷积神经网络来解决分类任务。
在经历了所有的模式识别技术之后,很明显,对于任何用例,没有一种算法总是最有效的。因此,各种机器学习和模式识别算法的组合会产生最佳结果或实现高效和优化的模式检测器。
因此,许多模式识别项目都基于混合模型,以根据数据的类型和可用性增强特定用例的模式识别器的性能。
例如,深度学习方法取得了出色的结果,但计算量很大,而“较轻”的数学方法通常效率更高。此外,在应用AI模式识别模型之前应用数据预处理方法是很常见的。
使用混合模型将提高整个应用程序或检测系统的性能。
模式识别系统的设计主要涉及(1)数据采集和预处理,(2)数据表示,以及(2)决策制定。
模式识别过程本身可以结构如下:
将模式识别用于股票市场预测应用程序是一项经典但具有挑战性的任务,目的是估计公司股票或其他交易资产的未来价值。线性和机器学习方法都被研究了几十年。直到最近,深度学习模型才被引入并迅速流行起来。
基于机器学习的模式识别用于生成、分析和翻译文本。因此,模式用于理解人类语言并生成文本消息。因此,对单词的文本识别用于对文档进行分类并自动检测敏感文本段落。因此,文本模式识别用于金融和保险行业进行欺诈检测。
手写识别用于比较手写文本或签名之间的模式以识别模式。笔输入的手写词的计算机识别涉及各种应用。然而,手写文字识别和识别是一个具有挑战性的领域,因为手写文本涉及不规则和复杂的形状。
图像识别算法旨在检测视觉图像中的模式以识别特定对象(对象检测)。一个典型的图像识别任务是图像分类,它使用神经网络根据描述的内容标记图像或图像片段。这是视觉搜索的基础,用户可以在其中轻松搜索和比较标记图像。
语音识别系统使机器能够接收和解释听写或能够执行口头命令并相应地进行交互。语音识别基于用于模式识别的机器学习,可以识别和翻译口语。
模式识别中的机器学习应用于图像或视频片段,以分析和检测观众的人类情绪。目标是表明观众或客户的情绪、意见和意图。因此,深度学习被应用于检测人脸表情和动作的特定模式。这些见解用于改善营销活动和客户体验。
模式识别方法提供各种好处,具体取决于应用程序。一般来说,在数据中寻找模式有助于分析和预测未来趋势或基于特定模式指标开发预警系统。其他优势包括:
模式识别算法可应用于不同类型的数字数据,包括图像、文本或视频。寻找模式可以对结果进行分类,从而做出明智的决策。模式识别可用于完全自动化和解决复杂的分析问题。