利用数据库性能指标有限性能判断哪些字输错了

安全检查中...
请打开浏览器的javascript,然后刷新浏览器
< 浏览器安全检查中...
还剩 5 秒&您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
数据集成关键技术研究-海洋信息探测与处理专业毕业论文.pdf 103页
本文档一共被下载:
次 ,您可全文免费在线阅读后下载本文档。
&#xe600;下载提示
1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值,立即自动返金币,充值渠道很便利
需要金币:200 &&
数据集成关键技术研究-海洋信息探测与处理专业毕业论文
你可能关注的文档:
··········
··········
随着网络应用和企业决策支持系统的需求持续增长,数据集成的需求也目益旺盛。
集成系统带来的巨大效益又吸引更多的企业投入大量资金用于集成,因此一些企业和
研究团体倾注了大量的努力,使得数据集成成为时下的一个研究热点。
数据集成是数据转换、清理以及加之其上的操作的集合。异构数据源集成时,其
中的一些数据源包含有脏数据的可能性很高,数据格式也存在很大差异,因此往往需
要对数据进行清理和转换;另一方面,集成系统的目的是为为用户提供高质量的服务,
集成系统上的操作也是一个数据集成的一个重要内容。
目前数据转换在功能、效率、以及支持自动转换等方面存在不足,作者对转换方
法、数据转换的优先次序算法、XML与关系模式之间的自动转换算法等进行了研究。
在数据清理方面,作者研究了重复记录的识别算法、基于模糊理论的等值理论以及人
工交互的便利性等问题。在操作方面,数据立方作为一种能有效分析数据的集成系统
得到了广泛的应用,因此作者对数据立方的范围查询问题进行了研究。在结合前人研
究成果的基础上,探讨了基于国产数据库DM4的集成工具DMCleaner的系统设计。
作者首先研究了从一种关系模式到另一种关系模式的转换,提出了两阶段转换的
方法,并给出了该方法基于XML的算法实现。传统转换工具采用一个阶段完成转换
工作,不能直接实现复杂的诸如多表聚集等功能的转换,需要用户编程,缺乏重用性。
该方法采用两个阶段实现数据转换,通过指定第一阶段的操作将数据转换到一个中间
模式,然后通过指定第二阶段的操作实现从中间模式到最终目的的转换,能有效支持
聚集操作。为解决有外键约束存在时由于转换次序选择不当导致的转换失败问题,提
出了转换优先次序算法。
化算法,通过将属性集快速分解为非关键字列集和关键字列集的方法,能够快速得到
和NeT算法同样的结果,避免了费时的nest操作,因此提高了关系模式到XML模式
的转换速度。
在XML到关系的转换方面,基于正则树语法的转换算法存在生成的关系数目过
多的缺点,作者通过限制元素生成的关系数的方法,减少了关系的数目。
在数据清理方面,作者首先深入研究了重复记录识别算法,将模式匹配算法引入
到数据清理的记录内算法中,对其进行了分析和改进,并提出了一些新的算法。第一,
启发式剪枝改进算法将过滤算法和启发式剪枝算法相结合,加快了算法的执行速度。
I求经弦曩导酃弼意
翱全文公布
第二,引入了长度约束条件。长度约束条件可有效减少关键字段属性不等长时的比较
次数,提高记录内算法的执行速度。试验表明,长度约束条件和启发式剪枝改进算法
具有较明显的效果。第三,提出了基于动态规划的缩写发现算法。该算法考虑了数据
清理过程中缩写形式造成的重复记录识别问题,能够进行中英文缩写发现,并能识别
存在缩写时的重复记录。第四,增量式多路优先队列算法IMPQ通过指定聚类队列的
最大长度的方法,减少了队列数据的数量,从而减少了比较次数,提高了执行效率。
第五,提出了数据仓库更新的增量式清理的方法。数据仓库数据庞大,数据刷新频繁,
不清理难以保证数据质量,增量式清理方法为此提供了一个可行的思路。
等值理论是用于决定给定数据是否重复的理论,是数据清理的一个核心问题之一。
而传统等值理论是非此即彼式的,容易产生规则冲突现象,使得清理规则的编写和选
择十分困难,而基于语义的等值理论受到人工智能的约束,在较长的一个时间里难以
实现。因此,作者提出了基于模糊理论的等值理论,引入了相关的模糊运算和等值度
的计算方法,解决了规则冲突问题,并能根据等值度对数据进行区间浏览。同时,通
过设置关键字特别是关键字“Report”,使用户生成较小的、内容相似的曰志文件,便
于用户查看和人工干预。这些大大缩短了操作的时间,有利于数据质量的提高。基于
模糊理论的等值理论还在一定程度上符合语义清理趋势,丰富了数据清理的等值理论。
重复记录识别过程中,正确数据的确认目前还需人工处理,因此作者提出了聚类
清理方案和聚类闭包算法。通过聚类闭包算法计算重复记录闭包,将重复记录聚类显
示,用户能一次性处理完一个重复的数据聚类,大大提高了重复记录的人工处理速度。
在集成系统的操作上,作者研究了数据立方的范
正在加载中,请稍后...(window.slotbydup=window.slotbydup || []).push({
id: '2014386',
container: s,
size: '234,60',
display: 'inlay-fix'
&&|&&0次下载&&|&&总164页&&|
您的计算机尚未安装Flash,点击安装&
阅读已结束,如需下载到电脑,请使用积分()
下载:50积分
0人评价3页
0人评价5页
0人评价205页
0人评价5页
3人评价83页
所需积分:(友情提示:大部分文档均可免费预览!下载之前请务必先预览阅读,以免误下载造成积分浪费!)
(多个标签用逗号分隔)
文不对题,内容与标题介绍不符
广告内容或内容过于简单
文档乱码或无法正常显示
文档内容侵权
已存在相同文档
不属于经济管理类文档
源文档损坏或加密
若此文档涉嫌侵害了您的权利,请参照说明。
我要评价:
下载:50积分6自动化学报XX卷;介绍近年来传统领域知识和CNN相结合的手写汉字识;1)数据生成技术:为了避免在训练过程中出现过拟合;文献[129]采用更深的CNN网络(15层,其中;图1列举了几种常用的数据增广技术所生成的;样本.可见在手写识别问题中,只要在不改变原字内部;图1Fig.1;几种常用的手写汉字数据增广技术示意图Thein?;thetrackingerror
6自动化学报XX卷介绍近年来传统领域知识和CNN相结合的手写汉字识别方法.1)数据生成技术:为了避免在训练过程中出现过拟合(Over?tting)以及提升CNN模型的识别性能,除了采用Dropout等一些经典的方法之外,获取充足的训练样本是保障CNN等模型获得高性能的前提.但很多时候我们获得的训练样本是十分有限的,例如像CASIA-HWDB/CASIA-OLHWDB这样优秀的数据集,其书写者仍然有限(不到1080人),且采集地区有限,不足以覆盖全国汉字书写者的统计分布,因此,数据增加(Dataargumentation)技术是一种非常重要的提升CNN系统鲁棒性及推广能力的技术.早在文献[45]中LeCun等学者就提出了采用平移、尺度缩放、旋转、水平及垂直拉伸变形(Squeezing、Shearing)等方法对数据进行变形,有效地提升了识别性能.文献[111]在仿射变换的基础上,进一步提出了弹性变形(ElasticDistortion)等两种数据生成技术,利用CNN在MNIST获得了99.60%的优异性能,文献[16]利用三角函数构成的非线性函数,提出了针对手写汉字的24种整形变换方法,也可看成是一种有效的手写伪样本数据生成方法[61];文献[17-19]提出了多种不同的手写伪样本生成技术,也被证明对识别性能的提升是有效的.文献[129]提出了19种手写伪样本生成方法,包括仿射变换、局部弹性形变、非线性拉伸、图像加噪、模糊化、对比度变化等,针对NIST-19手写数据集,生成了超过8.19亿的巨大样本,有效解决训练样本数据量不足问题.除了在手写字符识别领域之外,在自然场景文字检测与识别领域,数据生成技术也常常被证明是十分重要且有效提升深度学习模型性能的技术手段[96,128].文献[129]采用更深的CNN网络(15层,其中9个卷积层),同时结合三维随机变形技术进行了大规模的数据生成,除文字模式图像上的X坐标、Y坐标外,将各像素的灰度值作为Z坐标的参数,即可生成各种变形模式,模拟光影以及笔画轻重的变化,并借鉴GoogLeNet在网络中间层引入多个输出层以进行多层次监督学习的实现,在ICDAR2013脱机手写汉字识别比赛测试集上用5个CNN网络投票的结果为96.79%,是迄今为止在该数据集上公开报道的最好的识别结果.此外文献[129]的方法在MNIST手写数字上的识别结果为99.82%,这也是迄今为止我们所知的在该数据集上公开报道的最好的识别结果.Yang等进一步基于CNN的分类器设计之中[61]引入了伪样本生成技术[16],应用于联机手写汉字识别,通过实验证实伪样本技术弥补了在DCNN训练中数据不足、泛化能力不够的问题.图1列举了几种常用的数据增广技术所生成的样本.可见在手写识别问题中,只要在不改变原字内部结构关系的情况下,能够丰富样本空间的样本个数的数据增广技术都值得考虑使用.值得注意的是,在使用数据增广技术时,需要控制样本变换的程度,使得生成样本尽量符合实际样本分布.图1Fig.1几种常用的手写汉字数据增广技术示意图Thein?uencesofthecontrollerparametersonthetrackingerrors2)方向变换特征:在文献[10]中,除了提出了稀疏CNN模型之外,Graham引入一种新的领域知识Signatureofpath[130?131](路径积分特征)作用于CNN的输入层,被证明是一种非常有效的联机时序信息特征提取方法,由于该SignatureofPath[127]特征图的引入,使得其在CASIA-OLHWDB数据集上的识别结果明显优于MCDNN的方法,并且取得了ICDAR2013年联机手写中文汉字识别比赛的第一名.Graham在文中还验证了路径积分特征的有效性,在CASIA-OLHWDB1.1数据集上,若不采用路径积分特征图,CNN最佳错误率为5.12%,而引入路径积分特征图之后,错误率大幅降低到3.82%,相对错误率下降了25.39%,充分说明了路径积分特征图这一领域知识的有效性.8期金连文等:深度学习在手写汉字识别中的应用综述7图2Fig.2手写汉字的路径积分特征图可视化PathsignaturefeaturemapvisualizationofhandwrittenChinesecharacters值得一提的是,路径积分特征图是近年来提出的一种很好的描述联机时序信号的特征,文献[40,60?61]将之引入与CNN结合,在联机手写中文识别中取得了很好的效果,文献[62-63]应用其来进行书写者鉴别,相比传统方法,大幅度提升了识别精度,在NLPR手写签名数据集上取得了迄今为止最好的识别率.路径积分特征是通过路径的多重累积分获得多阶特征,文献[131]中给出了路径积分的具体数学定义描述,文献[40]中则举例说明了路径积分的计算过程,文献[62]对其在手写汉字的提取进行了可视化,如图2所示.从物理意义上看,第0阶路径积分代表轨迹的二值图像信息,第1阶代表轨迹采样点的位移信息,第2阶代表轨迹内采样点的曲率信息,以此类推.相比较之前在联机手写汉字识别被广泛采用八方向特征[24],可以看到路径积分特征图提取的方向信息及梯度变化信息更为丰富完整.此后,Yang等进一步在基于CNN的分类器设计之中加入非线性归一化[14?15]、虚拟笔画技术[20?22](对联机数据)、八方向特征[24]和路径积分特征图[40](对联机数据)等相关领域知识作为先验知识,进一步提高联机手写汉字的识别性能[61].通过实验得到以下观点:1)虚拟笔画技术在DCNN中能够很好地权衡真实笔画和虚拟笔画之间的权重分配,明显改进识别结果;2)8方向特征和路径积分特征的互补可以取得更好的结果.在脱机手写汉字方面,文献[77]借鉴在计算机视觉领域参加2014年ImageNet大规模图像识别竞赛(ILSVRC2014)获得了物体识别第一名的GoogLeNet的网络结构,对其进行了精简和改进,并引入脱机手写汉字识别领域中常用的几种领域特征提取方法如多尺度多方向的Gabor特征、八方向梯度特征等到GoogLeNet,提出了一种改进的HCCR-GoogLeNet模型,在ICDAR2013比赛数据集上取得了96.74%的识别率,首次在该数据库上超过了人类的识别水平(96.13%)[39],该工作同时表明手动提取的汉字特征图作为先验知识的嵌入到CNN网络之中,能够帮助CNN网络更好学习到汉字的辅助特征,有效提高网络的识别性能.2.3其它改进的CNN识别方法在手写汉字识别领域,为了进一步提升深度学习模型的性能,研究人员除了加大模型深度和宽度及将传统领域知识与深度模型相结合之外,还对深度学习的网络结构和训练方法进行了各种改进.CNN中常见最大值聚合(Max-pooling,MP)操作的大小和步长一般都是整数(例如大小为3×3,步长为2),Graham[132]对此提出了更一般化的分数最大值聚合方法(Fractionalmax-pooling,FMP).FMP使用的聚合区域大小是1到2之间的一个随机分数,因此需要比以往更多的隐层来确保特征图缩小到合适大小,因此FMP可以防止传统MP中卷积层特征图快速缩小造成的信息丢失过快的问题.除此之外,FMP因为引入了随机聚合区域大小,因此在测试阶段可以对每个样本进行多次不同区域大小的FMP从而得到多个测试结果,集成后可以提高识别率.实验证明[132],使用FMP思想设计的单个网络在CASIA-OLHWDB1.1上单次测试错误率为3.26%,在不需要增加模型存储量情况下,多次(12次)测试集成结果能有效降低2.97%.除此之外,研究者对深度模型的样本训练方式也做出改进.传统最简单有效的样本训练方式是使用Mini-batch模式,每个Mini-batch内的样本是从总样本集合中随机抽取,每个样本被抽取的机会均等.Yang等[61]从心理学对人的记忆遗忘规律的8自动化学报XX卷研究中受到启发,提出DropSample训练技术.因为在大规模的手写样本中,CNN理解每个样本的难易程度不同,在训练的后期大量已充分学习的样本无需反复训练,而错误标记的样本或严重噪声干扰的样本应该从训练集中剔除,对还未很好学习理解的样本则需要频繁进入网络训练.DropSample训练方法给每个样本设置一个配额,根据CNN识别输出的置信度为依据[82],对当前网络输出的置信度高低来动态调整该样本被选入Mini-batch训练的概率,使得网络训练更加高效;DropSample对未很好掌握的样本反复学习,能够提高网络的泛化能力.由于DropSample作为一种深度模型训练方法,只影响每次样本抽取的概率,因此能够很好地和其他神经网络结构或改良技术相结合,从而进一步提高性能.文献[61]在多个数据集上实验,使用DropSample训练并集成多种领域知识的CNN,最终单个网络在CASIA-OLHWDB1.1上取得3.43%的错误率,9个不同领域知识的网络集成的结果为2.94%.在ICDAR2013联机手写中文竞赛的数据集上,Drop-Sample训练CNN集成后最好结果是2.49%,是目前我们所知的公开文献报道中最好的结果.另外,文献[76]提出了两种改进的CNN模型用于脱机手写汉字识别:RelaxationCNN(R-CNN)及Al-ternatelytrainingCNN(ART-CNN),R-CNN网络与传统的CNN相比,主要区别在于其不进行卷积层的权值共享,这样做的一个潜在动机是为了使每个相应的神经元都能独立地学习有效的特征,并且防止过拟合,但此网络的缺点是将导致存储量明显增大;而ART-CNN在R-CNN的基础上,进一步提出了一种新的动态调整学习率的训练策略,在训练过程中,每隔N次(例如10次)随机将某个权值矩阵学习率设置为0,从而对相应的权值不进行学习和更新,采用此策略可以极大提升训练速度.文献[76]利用10个ART-CNN网络进行集成,在ICDAR2013比赛数据集上,获得了96.06%的性能.此外,ART-CNN网络在MNIST手写数字识别实验上,也取得了0.25%的较低的错误率.此后,富士通研究开发中心进一步改进了R-CNN模型,并结合大数据生成基础,单个网络的识别率已经提升至96.79%[129].表2总结对比了不同的深度学习方法在联机手写中文单字符数据集CASIA-OLHWDB1.1上的识别结果.表3总结对比了几种典型的深度学习方法在CASIA-OLHWDB1.0、CASIA-OLHWDB1.1、ICDAR2013联机手写中文单字符识别竞赛数据集识别率情况.表4为不同方法在ICDAR2013脱机手写汉字竞赛集上的识别性能对比.由于某些方法并没有在文献中提及其训练时间和测试速度,所以在比较中更关注识别性能和字典大小的对比.2.4基于其他深度模型的识别方法拥有多个隐层的全连接神经网络一般可以统称为DNN,例如含有多个隐藏层的多层感知器神经网络,传统的多层神经网络的训练容易过拟合、容易陷入局部最优,而且随着层数加深会出现梯度弥散等问题.2014年,Du等[65]将传统方法和DBN方法结合,使用了三种分类器:原型距离、DNN和Bottleneck特征(BNF)分类器.原型分类器由聚类算法构建,使用基于最大样本分离边界(Sampleseparationmargin,SSM)的最小分类误差(Mini-mumclassi?cationerror,MCE)准则[67]进一步改进,是一个小型且高效的分类器.DNN分类器则是对每个样本后验概率进行建模,它将每两层连续的神经元作为一个RBM,从而使用RBM的分层预训表2不同方法在CASIA-OLHWDB1.1联机手写中文单字数据集上的识别结果对比Comparisonwithdi?erentmethodsontheCASIA-OLHWDB1.1方法传统最佳方法:DFE+DLQDF[66][10]Table2准确率HDNN-SSM-MCEMCDNN[127]DeepCNet[40]DeepCNet-8方向直方图特征[40]DCNN(4种领域知识融合)[60]HSP-DCNN(4种领域知识集成)[64]DeepCNet-FMP(单次测试)[132]DeepCNet-FMP(多次测试)[132]DropSample-DCNN[61]DropSample-DCNN(集成)[61](%)94.96.96.96.5597.06伪样本变形模型集成(模型数量)××√√√√√√√√√××√(35)×××√(8)×√(12test)×√(9)表3不同深度学习方法在CASIA-OLHWDB1.0-1.1以及ICDAR2013竞赛数据集上的识别结果Comparisonwithdi?erentmethodsontheCompetitionDBCASIA-CASIA-ICDAR2013OLHWDB1.0OLHWDB1.1竞赛数据集95.94.39CCC96.96.9397.3396.5597.0697.23197.51Table3CASIA-OLHWDB1.0-1.1andICDAR2013OnlineMQDF传统方法[10]MCDNN[127]DeepCNet[40]DropSample-DCNN[61]DropSample-DCNN(集成)[61]1DeepCNet模型参数大约为590万个,DropSample-DCNN的模型参数为380万个.8期金连文等:深度学习在手写汉字识别中的应用综述9表4不同深度学习方法及部分典型的传统方法在ICDAR2013脱机手写汉字竞赛集上的识别性能Comparisonwithdi?erenttraditionalandCompetitionDB方法Table4deep-learningbesedmethodsontheICDAR2013O?ineTop1(%)96.2896.35Top5(%)99.5699.60Top10模型存储量(%)99..8027.77MBHCCR-Gradient-GoogLeNet[77]HCCR-Gabor-GoogLeNet[77]HCCR-Ensemble-GoogLeNet[77](averageof4models)HCCR-Ensemble-GoogLeNet[77](averageof10models)CNN-Fujitsu[39]MCDNN-INSIA[74]MQDF-HIT[39]MQDF-THU[39]DLQDF[39]ART-CNN[76]R-CNNVoting[76]ATR-CNNVoting[76]MQDF-CNN[78]Multi-CNNVoting[129]2比性.两个主流的深度神经网络CNN和DBN相比较而言,CNN不需要预训练,则相比于DBN的逐层预训练要省时,同时CNN因为加入卷积操作,能够更好处理图像信息,DBN则主要处理一维的数据,因此在手写体汉字识别中,CNN比DBN略胜一筹.此外,SAE等其他深度模型在大类别手写中文文字识别中的成功应用报道尚不多见.96.110.91MB96.277.25MB94.92.95.96.79n/an/an/an/an/an/an/an/an/an/a99.99.13n/an/an/an/an/an/aMB120MB198MBn/a51.64MB251.64MBn/an/a2.5基于RNN/LSTM的文本行识别方法如前文所述,采用深度学习等技术之后,目前手写单字符识别问题已经在某种程度上获得了较好的解决,但相对单字符识别而言,含序列信息的手写文本行识别仍然是此领域还未解决的难点问题之一.针对此问题,一个有极大潜力的解决办法是应用深度学习方法中回归神经网络(RNN)模型,特别是LSTM和BLSTM等模型,由于对序列数据有很好的建模能力,因此它们更适合于解决诸如包含时序先后顺序信息的文字行识别问题.基于LSTM-RNN[47]和CTC(Connectionisttemporalclassi?cation)[133]的方法在英文、拉丁文等西方语言的脱机文本行识别中取得了很好的结果[133?137],包括英文[70]、孟加拉文[72]和蒙古文[73]等语言的联机手写识别中也已经取得了很多成功应用的报道,但在大类别手写汉字识别中的应用报道很少.文献[138]是首个将LSTM-RNN和CTC训练框架应用于大类别(3755类)脱机中文文本行识别的工作,提出了多维LSTM回归神经网络(MDLSTM-RNN)的方法和CTC训练框架,来进行端到端的手写中文文本行识别,并结合语言模型的无切分策略方法进行中文文本行识别.未采用语言模型时,在ICDAR2013脱机手写体文本行识别竞赛数据集上CER指标最好可达到10.6%,AR指标达到90.4%,已基本上达到目前此领域先进水平.基于MDLSTM与传统方法在ICDAR2013竞赛数据集上的识别结果对比如表5所示.表5Table5根据文献[76]给出的模型参数(CNN层数、各层卷积核大小及数量、聚合层大小及数量、全连接数量),按照每个参数以浮点数存储(占用4个字节)方式推算而得.练方法[68],之后进行有监督的精细微调训练.BNF分类器则是用到了训练好的DNN模型中拥有较小神经元个数的一层(Bottlenecklayer)作为降维后的特征,输入原型分类器训练.这三种分类器集成,可以在提高大类别联机手写汉字识别率的同时,有效控制模型大小和测试时间.文献[66]提出了将训练DNN作为特征转换模型,在此基础上进一步提出多级DNN(HierarchicalDNN,HDNN),采用传统的特征提取方法,输出单元分解为多个子空间,每一个用DBN进行训练.一般的网络集成方法是训练多个完整的网络后对结果进行集成,HDNN则是将输出层的向量分成多个子向量,每个子向量由一个基本的DNN单独训练,这样兼顾网络的深度和宽度,使得每个网络的训练更加容易,在CASIA-OLHWDB1.1上最好的识别结果为89.39%.与文献[66]类似的方法被用来进行手写汉字书写者自适应[69],采用的深度DBN以RBM作为基本单元,从DBN的最后一层的输出作为特征,分类器采用SSM-MCE训练多原型距离分类器,在15000个超大类别的手写中文识别实验中,未进行书写者自适应前,分类器识别率约为81.21%;进行书写者自适应学习,采用风格转移学习的方法,最高识别率可达到91.86%.由于文献[65,69]并没有公开其实验的数据库,也未在公开的数据集如CASIAOLHWDB上进行实验,所以其方法与别的方法暂时不具备可不同研究方法在ICDAR2013O?ineTextCompetitionDB数据对比记录表Comparisonwithdi?erentmethodsonthe方法/系统名称ICDAR2013O?ineTextCompetitionDBHIT-MQDF+LM[39]THU-MQDF+DP[39]MQDF+MultipleContexts[35]MDLSTM-RNN[138]MDLSTM-RNN+LM4-gram[138]CR(%)AR(%)CER(%)88.886.713.386.183.66.489.390.210.7n/a83.516.5n/a90.410.6此外,近年来我们看到了越来越多应用RNN及LSTM的方法并应用到文档分析与识别多个其10自动化学报XX卷他领域,包括语言分类[139]、文档版面分析[140]、中英文语言模型建模[98?102]、自然场景文字检测及识别[141?142]等方面.其中值得一提的是近年来有不少学者把RNN与CNN结合,成功应用于解决OCR文字识别问题.例如文献[141]是利用滑动窗口方法,将滑动窗口区域的字符输入CNN,得到有序的高度抽象的特征序列,将得到的序列作为RNN的输入,得到最终识别结果.文献[142]先利用CNN对整个输入图像提取特征,将最后一个卷积层特征图的不同维度的同一列组成一个特征矩阵,不同列构成了有序的特征矩阵序列,作为RNN的序列输入.上述两种CNN+RNN相结合的方法,都是可训练的端到端的深度学习模型,我们期待类似的网络结构在不久的将来也能被应用于解决大类别手写文本行识别问题并取得突破性进展.3总结、讨论与展望本文简要回顾了手写体汉字识别的研究背景,介绍了传统手写汉字识别系统中各个主要步骤所涉及到主要技术,指出当前研究的主要困难及所面临的挑战.然后介绍了CNN、RNN、LSTM、SAE、DBN等几种主要的深度学习模型,总结了一些主流的深度学习开源仿真工具.在此基础上,详细综述及分析了近年来采用基于深度学习的方法在联机及脱机手写体汉字识别的最新进展,总结了各种深度学习模型在手写体汉字识别的研究现状.近年来,由于智能手机、平板电脑等触屏智能设备以及以MicrosoftSurfacePro4、iPadPro、三星Note4等为代表的手写笔交互的移动互联网智能设备的迅猛发展,并逐渐在人们日常生活中占据重要地位.随着触屏智能手机代替传统键盘手机,笔交互设备的第二次复兴,文字输入从原来纯键盘的拼音或五笔输入方式将逐渐变成虚拟键盘、手写和语音等多种输入结合的方式.艾媒咨询2015年第二季度中国市场调研数据显示[144]:输入方式的使用比例中,手写输入方式占13.1%,仅次于九宫格拼音(占47.2%)和全键盘拼音输入(占24.8%),并远大于语音输入(占5.8%)和五笔输入(3.6%),手写输入用户连续三年呈现平稳增长态势,手写输入作为一个重要的触屏交互应用也逐渐流行并广受重视,每天将产生大量的各种各样手写样本.因此,中文手写识别技术仍然值得更多的关注和更深入的研究.手写体汉字识别经历了四十多年的长足发展,在单字和文本行识别性能上有了很大的提高,特别是以CNN为代表的一系列深度学习模型的出现,手写单字符中文识别问题已经基本上得到了很好解决,无论是联机还是脱机手写中文字符识别,目前基于CNN及其改进模型的方法均取得了接近甚至是超过人眼识别性能的高识别率.然而,在手写汉字识别领域,仍然很多值得研究的问题有待解决,例如:1)手写文本行识别问题:目前基于深度学习模型的联机及脱机手写文本行识别的成功报道很少,自从ICDAR2013中文手写文本行竞赛以来,近两年在此方向上仍然没有突破性进展,对于联机中文手写文本行识别,目前最好的识别率指标(CR或者AR)均才达到95%左右[36,38],而脱机手写文本行识别最好的AR及CR指标仅为90%左右[35,138],特别是以整行为单位来评价识别率,行级别的识别率将会很低,仍然有很大的提升空间.可以说联机及脱机手写文本行识别仍然是未解决的难题.一些值得关注的研究方向包括:a)融合基于切分+基于CNN的单字识别+路径优化算法,这当中有不少关键技术需要解决,例如如何提升CNN的置信度的可靠性、能否用CNN的方法进行字符分割等等;b)基于无切分的RNN/LSTM/BLSTM的滑窗式识别方法,此方面对于小类别的拉丁文字已经成为公认的最佳方法,但对于大类别的汉字识别问题是否最优仍然值得商榷及探讨;c)基于CNN+LSTM的端到端的纯深度学习解决方案.2)无约束的手写文字识别问题:其中一个值得关注的研究问题是旋转无关的手写识别问题,根据2010年发布的国家标准GB/T“联机手写汉字识别系统技术要求与测试规程”[144],手写输入软件及设备必须要能识别±45?的手写样本,然而目前市场上的绝大部分主流输入法产品均无法满足此要求.尽管一些研究人员注意到此问题,并开展了不少前期探索工作[67,140,145?147],但总体而言,此问题仍然远未得到有效解决.相信深度学习新技术的出现,将为解决此问题提供崭新的思路及技术手段.另外,目前的研究工作绝大部分局限于解决简单的问题,例如单字符识别或简单的文本行识别,对于联机手写重叠文本行识别、混合手写单字/文本行/重叠以及来自整屏任意无约束书写的手写汉字识别的研究工作仍然鲜有报道,这是一个值得研究的课题.3)超大类别手写汉字识别问题:目前手写汉字识别研究报道所能识别的文字类型基本上以国标一级字库3755类汉字为主,针对实际应用场景下要能识别10000个以上类别的实用化手写识别研究的报道还不多,且缺乏公开的超大类别(例如支持GB标准的27533类)训练及测试数据集.在如此大类别的情况下,如何研究一个处理速度快、模型参数足够小的可实用化的基于深度学习的解决方案将变得极具挑战性,从ICDAR2013手写中文竞赛的评测结果来看,基于深度学习的解决方案无论是在存储量还是识别速度上均还没有达到实三亿文库包含各类专业文献、文学作品欣赏、生活休闲娱乐、外语学习资料、中学教育、行业资料、幼儿教育、小学教育、深度学习在手写汉字识别中的应用综述_金连文60等内容。 
 深度学习文字识别论文综述 深度学习文字识别论文综述深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进 行分析学习的神经网络, 它模仿人脑的机制...  从人工智能角度看手写体汉字识别_计算机软件及应用_IT/计算机_专业资料。看了模式...脱机手写体汉字识别综述 5页 免费 特征融合用手写体汉字识... 暂无评价 5页 ...  10 深度学习综述摘要:深度学习是机器学习研究中的一...关键字:深度学习,神经网络,机器学习 Review of Deep...图 1―1 用于手写体字符识别的卷积神经网络 卷积...  脱机手写体汉字识别综述_计算机软件及应用_IT/计算机_专业资料。手写汉字识别的研究,基于matlab 脱机手写体汉字识别综述 摘要: 脱机手写体汉字识别是模式识别领域最具...  基于深度学习的人脸识别技术综述简介: 人脸识别是计算机视觉研究领域的一个热点, ...中文解析:使用深度卷积神经网络方法进行 3D 人脸重建 8.1 简介 当在真实场景中...

我要回帖

更多关于 数据库性能 的文章

 

随机推荐