文字识别环境的搭建

零、common environment

输入如下命令安装一些必要的配置:

sudo apt-get install build-essential

sudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev

sudo apt-get install python-dev python-numpy libtbb2 libtbb-dev libjpeg-dev libpng-dev libtiff-dev libjasper-dev libdc1394-22-dev

sudo apt-get install gcc g++ automake

一、worker 环境:

1、安装gearman:

(1)安装一些必要的libs:

sudo apt-get install gcc autoconf bison flex libtool make

sudo apt-get install libboost-all-dev libcurl4-openssl-dev curl libevent-dev memcached uuid-dev libsqlite3-dev libmysqlclient-dev gperf

 (2)安装gearman-1.1.12:

执行如下命令解压gearman-1.1.12:

tar -zxvf gearman-1.1.12.tar.gz

 之后会生成文件夹,然后跳转到解压之后的文件夹中执行此命令:

sudo ./configure --with-boost-libdir=/usr/lib/i386-linux-gnu/

sudo make & sudo make install

 执行上方第二条命令时,出现如下错误:

文字识别环境的搭建

 如果输入上面的第二条命令时真的出错的话,那就改成输入如下命令吧:

./configure
make
sudo make install

然后,输入如下命令查看gearman版本:

gearmand -V

效果如下:

文字识别环境的搭建

 上图中,既然版本都能看到了,那说明gearmand是肯定安装成功了的嘛。

  2).wrong!!(错误的安装方式)

    >>sudo apt-get install gearman( wrong : low vision)

    ( sudo apt-get install gearman gearman-job-server gearman-tools libboost-program-options1.54.0  libgearman7 libmemcached10 libpq5 memcached)

2、install curl:(提供web服务库)

sudo apt-get install curl libcurl3 libcurl3-dev php5-curl

3、安装libiconv:(解决乱码问题)

解压libiconv-1.13.1.tar.gz,然后安装。此时,需要输入如下命令来完成:

tar -zxvf libiconv-1.13.1.tar.gz
cd libiconv-1.13.1/

./configure
make
sudo make install

4、安装rapidjson:(解析json数据)

解压rapidjson-1.0.2.tar.gz:

tar -zxvf rapidjson-1.0.2.tar.gz

copy the directory ./include/rapidjson to /usr/include/:

cd rapidjson-1.0.2/

sudo cp ./include/rapidjson /usr/include/ -a

二、安装OCR环境:

1、安装tesseract库:

(1)安装必要的库:

sudo apt-get install libtool libpng12-dev libjpeg62-dev libtiff4-dev zlib1g-dev

 (2)解压并安装leptonica-1.70.tar.gz:

tar -zxvf leptonica-1.70.tar.gz

./configure & make & sudo make install //跳转到解压好的文件夹执行这个命令

 (3)解压并安装tesseract-ocr-3.02.02.tar.gz:

tar -zxvf tesseract-ocr-3.02.02.tar.gz

./confugure & make & sudo make install

 (4)将tesseract_lang_libs.tar解压,然后解压得到的三个文件,都要复制到目录/usr/local/share/tessdata/下:先在目录/usr/local/share/tessdata/中创建空的文件夹tesseract_lang_libs,然后将复制三个文件。

为啥要复制到这个目录呢, 根据后面运行工人程序报的错误就可以提示出:

文字识别环境的搭建

(5)配置环境变量:

将文件/etc/bash.bashrc打开,然后在末尾添加下面这句话:

      "export TESSDATA_PREFIX=/usr/tesseract-ocr/"

2、安装opencv:

(1)解压opencv-2.4.11.zip:

unzip opencv-2.4.11.zip

 (2)进入到opencv目录:

cd opencv-2.4.11/

cmake .
make
sudo make install

 (3)update pre-load library:

vim /etc/ld.so.conf.d/opencv.conf

 在这个文件的末尾加入如下内容:

/usr/local/lib

 然后执行如下命令:(百度一下,linux中ldconfig命令的意思)

sudo ldconfig

 (4)配置环境变量:

sudo vim /etc/bash.bashrc

 在这个文件的末尾加入如下内容:

PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/lib/pkgconfig
export PKG_CONFIG_PATH

3、安装mysql数据库:

sudo apt-get install mysql-server mysql-client

 然后设置数据库的密码。

继续输入如下命令:(这个命令是干什么的?)

sudo apt-get install libmysqlclient-dev

三、install samba服务器:(目的是做win7和ubuntu之间的文件共享)

(1)执行下面这条命令就可以安装了:

sudo apt-get install samba

 或者用下面这条命令也是可以安装的:sudo yum -y install samba

(2)修改samba的配置文件:

将下面的内容放到/etc/samba/smb.conf文件的最后面:

  [smyhvae]

     comment = smyhvae

     path = /home/smyhvae

     writable = yes

注:上面的“smyhvae”指的是我自己的用户名,你要改成你自己的。 

*add your user to samba user:

sudo smbpasswd -a smyhvae

注:上面的“smyhvae”指的是我自己的用户名,你要改成你自己的。 

--------------------分割线中的内容请先忽略------------------------------

这面这两个命令是干嘛的?(先忽略吧)

cd pro2/src/
vim makefile

文字识别环境的搭建

然后输入如下命令:

make

--------------------------------------------------------------------------------------------------------------

四、数据库表的创建:

文字识别环境的搭建

上图的目录介绍:

temp_coord:文本定位

temp_inf:模板信息

temp_str:忘了。。。

1、修改数据库的用户名和密码,有下面这几个文件涉及到用户名和密码,改成统一的即可:

(1)文件1:

文字识别环境的搭建

文字识别环境的搭建

上图红框部分是数据库的登录密码。

(2)文件2:

文字识别环境的搭建

文字识别环境的搭建

(3)文件3:

文字识别环境的搭建

文字识别环境的搭建

(4)文件4:

文字识别环境的搭建

文字识别环境的搭建

2、导入数据库:

文字识别环境的搭建

输入如下命令进入数据库的命令行操作:

mysql -u root -p

 然后输入密码即可。

文字识别环境的搭建

输入如下命令,创建上图中的四个数据库:

create database rboxasim;

create database rboxasim;

create database template_inf;

create database template_string;

 然后四个表就创建成功了:

文字识别环境的搭建

导入第一个数据库:

use rboxasim

source /home/smyhvae/Documents/OCR/tools/database/ocr_rboxasim.sql

show tables;

select * from ap_table;

 上方的四行命令中,02行是导入数据库,03和04行是查询表。查询表的效果如下:

文字识别环境的搭建

重复上面的四个命令,依次导入其他三个数据库。

在project2的src目录中执行如下命令就可以运行工人程序:

./worker

其他补充:

OCR\src\pro2\src目录下的ocr_worker.cc文件:

文字识别环境的搭建

上图中的ip指的是gearman应用对应的ip。

OCR\src\pro2\src目录下的ocr_file.h文件:

文字识别环境的搭建

上图红框部分指的是worker保存图片的目录。

现在,开始在linux中创建这个目录:

文字识别环境的搭建

因为这个目录是root用户的,现在。。。忘了。。。问张平。。。

worker的监管程序:

文字识别环境的搭建

更多相关文章
  • LAMP环境下搭建discuz论坛
    LAMP环境下搭建discuz!论坛一.下载discuz!1.创建目录mkdir /data/www2.进入目录cd /data/www3.下载discuzwget http://download.comsenz.com/DiscuzX/3.2/Discuz_X3.2_SC_GBK.zip4.解压d ...
  • ABBYY FineReader Engine用于开发ocr文字识别软件和图片识别软件,提供自己的OCR API, 包括光学字符识别(OCR).智能字符识别(ICR).光标识别(OMR).光学条码识别(OBR).文档图片.PDF转换技术和 图像识别技术.新的泰比ABBYY FineReader En ...
  • Android开发环境的搭建
    Android开发环境的搭建    对于Android我们应该不陌生,现在Android是非常火的.如果我们想自己开发Android软件,那么我们必须先搭建Android的开发环境.最基本的要求是我们的电脑上面已经安装了JDK并配置好环境以及安装Eclipse,这在前面已经说过了,这里不再重复.有两 ...
  • 浅析点对点(End-to-End)的场景文字识别
    一.背景随着智能手机的广泛普及和移动互联网的迅速发展,通过手机等移动终端的摄像头获取.检索和分享资讯已经逐步成为一种生活方式.基于摄像头的(Camera-based)的应用更加强调对拍摄场景的理解.通常,在文字和其他物体并存的场景,用户往往首先更关注场景中的文字信息,因而如何能够正确识别场景中的文字 ...
  • 在源码安装的LAMP环境中搭建Nagios(在这个项目中/usr/local/nagios/etc下面的文件是采用拷贝其它机器上的文件方式,所以如果涉及该目录中文件的修改都要根据具体情况而言!)首选查看日期时间是否准确,如不准确就将Ntpdate写入Crontab进行网络对时,*/1 * * * * ...
  • 1.Erlang 安装wget http://www.erlang.org/download/otp_src_R14B.tar.gz    tar -zxf otp_src_R14B01.tar.gz    cd otp_src_R14B01    ./configure    make     m ...
  • linux上LNMP环境的搭建
    一,LNMP概述      LNMP代表的就是:Linux系统下Nginx+MySQL+PHP这种网站服务器架构.       Linux是一类Unix计算机操作系统的统称,是目前最流行的免费操作系统.代表版本有:debian.centos.ubuntu.fedora.gentoo等. Nginx是 ...
  • 手动编译安装LNMP环境,搭建wordpress博客
    2013年6月27日-编译安装LNMP环境,搭建wordpress博客安装目录:1.系统环境:.........................................22.安装前系统设置:...................................23.安装gcc编译器及相关工具 ...
一周排行
  •   <dl class="widget link-list"> <dd><h3>明月博客时钟(此处换你自已喜欢的名称)</h3></dd> ...
  • 关于VMMap工具使用VMMap是一个免费的工具,可以用来分析应用程序使用虚拟和物理内存的情况. VMMap对程序员是非常有用的.如果您在寻找免费的工具来理解和优化您的应用程序的内存使用量 ,那么你可以尝试VMMap ...
  • 测试openstackneutron的网络连通性
    测试openstack网络连通性,方式如下:1.openstack控制端执行nova li ...
  • cd /var/lib/hg/limenghg update(未完待续)
  • 概要安全标识符 (SID) 是可变长度的唯一值,用来标识 Windows Server 操作系统中的安全主体或安全组.常用 SID 是标识一般用户或一般组的一组 SID.它们的值在所有操作系统中都相同.此信息可用于解 ...
  •  从今天开始写博客吧,写一些自己的工作中的产品操作经验,还有要转载一些好的文章.
  • 集群存储系统已经在存储服务器中运行了有段时间了.很多时候都是应用在重要的数据存储上.能够保证数据的存储持续性,以及服务的可持续性.那么到底什么是集群存储系统呢?他又是如何工作的呢.下文会给你一些实质上的帮助.两台控制 ...
  • NLB+DFS实现高可靠性WEB服务器
    应用场景:      公司采用windows 2k3 iis6.0做为WEB服务器,服务器 ...
  •     到了七月份,就毕业二周年了.在毕业后的日子里,我先是在某名企工作了半年,当时工资有三千多,由于刚踏入社会,被人教唆诱导,卷入了部门人事斗争中,在人事倾轧中,被赶了出来.在2008年初的五个月中,自己带着愤恨. ...
  • Ubuntu 使用apt-get安装Nginx php5-fpm MySQL(LNMP环境搭建)系统:Ubuntu 13.04 64位   ubuntu因为安全策略,一般是禁用了root用户,所以每次执行命令时一般需 ...