博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Linux Tesseract-OCR安装与训练样本
阅读量:7157 次
发布时间:2019-06-29

本文共 867 字,大约阅读时间需要 2 分钟。

hot3.png

  1. 安装对应的lib (install the libs)

   参考:

sudo apt-get install autoconf automake libtoolsudo apt-get install libpng12-devsudo apt-get install libjpeg62-devsudo apt-get install libtiff4-devsudo apt-get install zlib1g-dev

确保安装下面的lib:

 sudo apt-get install  gcc sudo apt-get install  g++ sudo apt-get install  automake

安装Leptonica:

$wget http://leptonica.googlecode.com/files/leptonica-1.69.tar.gz

$tar zxvf leptonica-1.69.tar.gz

cd到其目录下:

./configure && make && sudo make install

安装 Tesseract:

$wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz

$tar zxvf tesseract-ocr-3.02.02.tar.gz

 

cd到其目录下:

./configure && make && sudo make install

Install 后 需要 sudo ldconfig 

使用训练包的话需要先安装英文包

设置 TESSDATA_PREFIX 语言包所在的目录(语言包在Win下训练好后直接导入tessdata目录下即可)

export TESSDATA_PREFIX=/usr/tesseract-ocr/

2.训练样本

参考:

          

需要注意的是最后五个包的重命名

转载于:https://my.oschina.net/u/1450520/blog/290593

你可能感兴趣的文章
软工作业PSP与单元测试训练
查看>>
20个常用Expression Blend设计开发技巧 (2)
查看>>
C#:rdlc - 报表实例
查看>>
每个.NET 开发人员应该下载的十个必备工具
查看>>
Delphi中WebService服务
查看>>
微软产品组里的十一类人
查看>>
黑客盯上公益事业 洛阳中心血站被挂马
查看>>
mysql 的书籍推荐~
查看>>
HTML5学习笔记
查看>>
Eclipse helios 上编写arduino程序并进行烧录
查看>>
基于ArcGIS10.0和Oracle10g的空间数据管理平台二(C#开发)-登录功能模块
查看>>
8个很棒的 jQuery 倒计时插件和教程
查看>>
[iOS] UIView的clipsTobounds属性
查看>>
NSUserDefaults保存应用中的数据
查看>>
安装gevent错误/gevent/core.so: undefined symbol: event_global_current_base_ 的解决方案
查看>>
XML序列化点滴
查看>>
Android游戏与应用开发最佳学习路线图
查看>>
【转】NSJSONSerialization解析JSON数据
查看>>
POJ 3252 Round Numbers(数学问题)
查看>>
本地使用CVS
查看>>