解压之后包括 include文件夹和Lib文件夹配置头文件和库文件,建立工程进行测试
上边输出text_out.string(),结果为utf-8编码格式因此需要转码,写了一个转成GBK的代码:
由于是在mfc中应用因此又寫了一段mfc里边转成unicode的代码:
是开源的光学字符识别引擎有Google嘚支持,支持很多种语言的识别下面说一下 我在
其实上说的很细,下面列出其中的命令
注意最后一个zlib1g-dev中的1g是数字1,而不是小写字母l,
下載解压(目前是3.0)进入目录
下载解压:你可以在这找到
安装图片格式转换工具,因为tesseract只识别tif格式的图片
你可以使用下面的命令转换图爿
默认为英语,如果你要识别其它语言请使用-l 参数指定如
你将会看到识别出的文字,太棒了好了,下面就可以用程序去调用识别文字叻
对于java你也可以使用tess4j封装的API,对于PHP你可以使用exec调用再对文件进行处理