手写字符模式多变，自适应学习依据这些识别方法提高识别率-海文博阅网

首页 / 纵览天下 / 正文

手写字符模式多变，自适应学习依据这些识别方法提高识别率

Time：2025年04月10日 Read：55 评论：0 作者：haiwenboyue

手写字符的一个显著特点是模式变化性较大。其表现为模式空间的类内分布十分分散，且类间交叠情况严重。这就导致识别模型难以“恰当”地拟合每类模式的数据分布或类别之间的判别面。在识别模型的过程里，通过自适应学习，能够较好地拟合特定书写者笔迹特征向量的空间分布，进而有利于提高识别率。自适应学习的结果只是提升了对特定书写者的识别率。然而，倘若为不同人的笔迹特征向量提供不同的识别模型，就能够在总体上提升系统的识别率。

有几种自适应学习所依据的识别方法，从目前已有的文献来看大致如下：有基于 HMMs 的；有基于 ANNs 的；有基于（—）的；有基于子空间法的；还有基于模板匹配法的等。任何一种自适应学习算法都以一定的识别方法为基础。这些识别方法可分为两类，一类是分布拟合法，包括 HMMs、LS、TM 等；另一类是判别决策法。分布拟合法仅学习每一类的正例，不学习反例；判别决策法则同时学习正例和反例。显然，从模型的一致性角度来看，判别决策法比分布拟合法更优。

这种思想下，本文提出了一种算法。此算法基于 SVM 分类算法和函数。SVM 分类算法是一种判别决策方法，在很多识别问题中都有很好的实验结果。SVM 分类算法的输出是距离。参数化的函数会拟合 SVM 输出距离的类别后验概率分布。这样能使 SVM 的距离输出变换为概率输出。本文提出的算法以这种概率化方法为基础，通过自适应学习来修改参数，这样函数就能较好地拟合自适应数据输出距离的类别后验概率分布。因为输出距离是基于两类别的判别面的，所以输出距离的类别后验概率分布能够同时对正例和反例进行学习。

本文选取手写数字作为实验对象，对上文所提出的自适应学习算法进行了有效性的验证。

1 SVM算法及函数

1.1 SVM分类学习算法

1.2 函数

本文所采用的方法是，利用参数化的函数来拟合 SVM 分类决策函数的输出距离的类别后验概率分布，这样就能让其输出距离转变为概率输出。参数化的函数具体为：

1.3 求解A，B

为了避免所求出的参数 A、B 的值出现偏移情况，应当运用与训练集 D1 不同的数据集 D2 来求解 A、B 的值。具体而言，D2 为……

把 D2 中的所有数据代入到(6)式和(7)式中，通过求解 A 和 B 来算出(7)式的极小值问题。

2 基于SVM和函数的自适应学习算法

2.1 多类别分类器设计方法

适应系统与非适应系统_自适应学习_学着去适应

本文依据所提及的 SVM 算法以及 one--one 原则来设计多类别的分类器。假设有 n 个类别，那么总共就有 n*(n - 1)/2 个分类器。每个分类器的参数分别是权值 Wi,j、bi,j、Ai,j 和 Bi,j，其中 i 和 j 的取值范围是 1 到 n 。

2.2 概率输出下的多类别决策

概率输出情况下的多类别决策规则为：存在未知类别数据 x，把它代入(6)式后会有：

根据投票法原则，当 p(x)>0.5 时，第 i 类会获得 1 票；而当 p(x)

2.3 自适应学习算法

本文自适应学习算法的核心是利用自适应数据里的误识样本，来对参数 Ai,j 和 Bi,j 进行自适应的修正。

上脚标 i1 意味着 x 被误识别为 i1 类，同时 Mi1 表示被误识为 i1 类的样本数量。倘若存在第 i1 类的自适应数据集合

如果图片 [转到图文版]的误识样本集合 Ei1 里有被误识为 i 类的样本，那么 Ei 中被误识为 i1 类的样本与 Ei1 中被误识为 i 类的样本将会构成正反例集合 Ep 和 En ；倘若 i

把误识样本的正例集合 Ep 和误识样本的反例集合 En 代入到(9)式当中，并且依据梯度下降法可以得知：

Aoid 和 Bold 是在进行自适应修正之前的参数值，而 Anew 和 Bnew 则是经过自适应修正之后的参数值。

3 实验结果

3.1 预处理及特征提取

自适应学习_学着去适应_适应系统与非适应系统

本文以O～9十个数字作实验。预处理及特征提取的步骤如下：

首先对二值图像进行非线性归一化操作，归一化后的图像尺寸是一个 64*64 的方阵。

(2)在非线性归一化后的图像上提取轮廓。

提取轮廓图像的 DEF( )特征，该特征的维度为 1024。

对 1024 维的特征进行 K—L 变换，将其特征维数压缩到 128 维。

3.2 实验结果

本实验的样本情况如下：样本是自行收集的。平均每个数字有 145 个样本。其中 90 个样本被用于学习判别面的参数 W 和 6 。设定 C 为 1000 ，设定为线性。所采用的软件是[具体软件名称]。另外 55 个样本则被用来学习参数 A 和 B 。在自适应学习和测试阶段，一共收集了 5 个人的样本。每个人平均每个数字的样本数是 35 个。表 1 展示了自适应学习的结果。

本实验仅对线性核的识别情况进行了测试。从表的统计结果里能够知晓，概率输出自身便能够提升识别率。在运用了本文所提出的自适应学习算法之后，识别率又有了进一步的提升，平均达到了 94.5%，相较于常规 SVM 方法提升了 5.1%。学习算法中的步长η会对识别率产生影响，且这种影响有一定程度。步长为 0.1 时的识别率比步长为 0.2 时的识别率要高。

本文提出了一种基于 SVM 和函数的字符识别自适应学习算法。此算法与基于 HMMs、ANNs、模板匹配、子空间法等识别方法的自适应学习算法不同，是一种全新的自适应学习算法，具备推广能力好以及模型一致性好等特点。今后的研究方向是设计自适应学习算法，此算法要能更好地适应自适应学习数据的参数 A、B；还要寻求自适应学习算法，该算法能找到更合适的拟合距离类别后验概率分布的函数以及判别函数本身的参数 W、b。

加入微信

原文链接：http://haiwenboyue.bjhwtx.com/news/3603.html

上一篇：女生最赚钱的十大职业排行榜：明星模特设计师等职业收入高

下一篇：青岛市公务员职业道德建设成效显著：健全制度、教育培训与实践养成并重

标签：