浅谈计算机视觉领域的图像分类研究现状
(161005 齐齐哈尔工程学院信息工程系 黑龙江 齐齐哈尔)
【摘 要】图像分类算法主要分为基于传统机器学习的图像分类算法和基于深度学习的图像分类算法。本文介绍不同类型图像分类算法的原理与应用场景以望为以后的研究者提供一定的参考。
【关键词】图像分类;深度学习;特征提取
一、传统传统的图像分类算法
传统的图像分类算法主要在信息处理流程上包括有以下五个步骤:特征感知,图像的预处理,特征提取,特征筛选,预测类别。传统的图像分类算法主要取决于特征提取算子,SIFT算子是其中最具代表性的算子,即尺度不变特征变换。即使少数的几个样本也可以产生大量的SIFT特征向量,而且可以很方便地与其它形式的特征向量进行联合。此外,HOG、LBP、GLOH和SURF等算子均在传统图像分类算法的对象检测中扮演着重要的角色。与深度学习算法相比,传统的图像分类算法主要有以下三点优势:
(1)小数据集上表现更佳
为了提高模型的性能,深度学习网络通常使用非常大的数据集来训练网络,较小数据集会造成模型过拟合的问题。
通常情况下,深度学习网络要取得良好的训练效果,训练使用的数据集的量级一般需要在百万级以上。在实际应用中,如此庞大的数据集很难获得,即使能够获得,也需要巨额花费且耗时耗力。对于较小的数据集,传统的图像分类算法通常优于深度网络。
(2)计算成本便宜
深度学习网络通常需要GPU强大的计算能力作支撑,且需要在大量数据上和一定的时间内进行反复训练调试。此外,想要高效地利用GPU的资源,还需要高性能的CPU、SSD存储以及快速且大容量的RAM做支持。传统的图像分类算法只需要一个性能一般的CPU就可以很好地完成训练,对硬件配置要求较低。由于训练成本较低使得传统的图像分类算法在训练时可以反复尝试从而更快地完成迭代。
(3)更易理解
传统图像分类算法一般利用的是直接的特征工程,解释和被理解较为容易。而且,经过一定程度的学习,就能够更为简单方便地调整超参数并更改模型设计。另一方面,深度学习网络存在很多未知,目前并不能完全了解其原理,一旦出现问题,如何找到问题所在并解决,就构成了一个主要的难点所在。
二、基于深度学习的图像分类算法
自从AlexNet深度神经网络在ILSVRC2012中以绝对优势获得冠军以后,深度学习开始流行起来,特别是卷积神经网络,在计算机视觉领域被深度研究与应]。历年ILSVRC竞赛图像分类Top5正确率由2012年AlexNet的83.6%,到2013年的88.8%,再到2014年VggNet的92.7%和GoogLeNet的92.3%,最后一届的冠军ResNet甚至达到了96.43%,超过了人类水平的94.9%。Top5正确率指的是给一张图片5个预测标签,只要有一个标签正确即为预测正确。与传统的图像分类算法相比,基于深度学习的图像分类算法有以下两点优势:
(1)无需特征工程
传统的图像分类算法依赖于复杂的特征工程,首先对数据集进行深度探索性的数据分析,然后通过简单的变换操作降低数据的维数,最后通过一系列的比较尝试选择确定最佳的特征提取方法,然后传递给传统的图像算法。当使用深度学习网络时,只需将训练数据传递给网络,然后训练模型,通常就可以得到具有良好性能的模型,深度学习算法省略了需要复杂操作的特征工程阶段。
(2)适应性强且易于转换
与传统的图像分类算法相比,深度学习算法可以更容易地运用到不同的领域和场景之中。首先,迁移学习技术可以使得预先训练的一个深度学习网络很好地适用于同一研究领域内的不同研究任务中。在现代计算机网络视觉研究领域中,预训练的图像分类的网络特征模型通常被当作对图像特征检测和对图像特征提取的工具。使用预先训练好的网络提取整个图像的基本特征,可以大大减轻整个模型的计算和训练的复杂度。此外,不同领域使用的深度学习的基本思想和技术通常也是可以相互转换的。如果了解了语音识别领域的基础深度学习理论,那么可以很好地将该深度网络应用于自然语言处理领域,因为二者基本的原理非常相似。对于一些传统的机器智能学习算法来说,情况并非如此,因为构建一个高性能机器学习的模型和算法需要特定领域和特定适合应用的机器智能学习技术和其对应的特征工程做支持。对于不同的领域和应用而言,经典机器学习的知识库相差甚多,通常研究者会在单独的领域内进行广泛的专业研究。
三、结束语
随着计算机视觉算法与基于集成电路的智能视觉系统的飞速发展,作为其分支领域之一的图像分类算法也在实现着日益更新。图像分类算法主要分为基于传统机器学习的图像分类算法和基于深度学习的图像分类算法。如今,深度学习在包括自然语言、图像分类等各种各样的任务中表现突出。
然而,尽管深度学习具有如此高的性能,但在一些特定的情形下,使用经典的机器学习算法要优于大型深度网络算法。
根据不同的应用场景,采取合适的图像分类算法解决实际问题是图像分类应用的趋势。图像分类领域仍需不断发展,以满足对计算机视觉领域对图像分类的需求。
参考文献:
[1]高建瓴,王竣生,王许.基于DenseNet的图像识别方法研究[J].贵州大学学报(自然科学版),2019,36(06):58-62.
[2]刘华祠.基于传统机器学习与深度学习的图像分类算法对比分析[J].电脑与信息技术,2019,27(05):12-15.
[3]苏赋,吕沁,罗仁泽.基于深度学习的图像分类研究综述[J].电信科学,2019,35(11):58-74.