java使用OCR

一、Tess4J

1.下载chi_sim.traineddata 和 eng.traineddata语言包（https://github.com/tesseract-ocr/tessdata）

2.pom文件引入


    net.sourceforge.tess4j
    tess4j
    5.0.0

3.示例代码

public static void main(String[] args) {
	Tesseract tesseract = new Tesseract();
	tesseract.setDatapath("D:\\tessdata\\data");
	// 简体中文：chi_sim，英文：eng
	tesseract.setLanguage("chi_sim");
	try {
		String result = tesseract.doOCR(new File("D:\\tessdata\\img\\test.png"));
		System.out.println("result: " + result);
	} catch (TesseractException e) {
		e.printStackTrace();
	}
}

测试识别内容：

Tesseract Introduction

做了一段时间的OCR。在PC的Visual Studio上和在TI/ADI的DSP上都做过。一般都是看项目的具体情况，然后根据这具体情况，设计一套算法。设计好了之后，这套算法就只能应用在这个项目上了。如果再来一个新的项目，就又得从头写起。可是，不就是做OCR吗，不都差不多嘛！要是所有的OCR项目都能使用同一套代码，那得有多帅呀！

想一想，要做这件事，大概有下面这么些挑战：

自动搜索文字。目前我做的文字定位，都是知道文字在图像的什么地方，然后用经验参数定位的。这样的话，就必须针对不同的识别任务，制订不同的识别参数。如果识别任务中表明不能确定文字所在的地方，那我就歇菜了。反之，如果能自动地定位到文字的所在之处，那不就离我的目标近了一步吗？

自动分割。目前我做的文字分割，基本都是预先知道有多少个字，字和字之前的间隔情况是怎么样的等等一系列的信息之后，才可以开始动手分割。可是如果我不知道这些信息呢？我又抓瞎了。

自动识别。非常不好意思，我现在能做OCR基本只能说在初级阶段。可以做英文和数字的OCR，而且还必须预先知道它们的字体是什么样的。要是任务中说，字体不定，那对不起，又是mission impossible。

测试识别结果：

result: Tesseract Introduction

做了一殷时间的 0CR。、在 PC 的 Viual Studio 上和在 T/AD 的 DSP 上部佩仪、一舫都星着顶日的其体情周 , 然后栗探讷咤体情周 , 设计一
娟藩法、设计好了之后 , 这套籁法尬司能应用在仪个顶目上了 , 加果育朱一个新的项目 , 就又得从头冗起 , 可是 , 不就是做 0CR@, 不
都悟万多嘉 ! 如显所有的 OCR 顶目鄂能傲用吟一娟代矿 , 那得有多师听 !

想一想 , 要健匹伦事 , 大梅有下面这么些技战 :

自动摸家文宇 , 目酶我做的文字定位 , 都是知文字在国像的什么地方 , 焦名用经验参数定他的 , 这样的话 , 就必顷针对不同的沙引
代务 , 制订不同的识刑参散 , 如果识别代务中表明万能磁定文字所在的地方 , 那我尬歇菜了 , 反之 , 如果能自动地定位刹文字的所
之犯 , 那万就高我的目标近了一步叨 ?

自动分列。目刑我侦的文字分剩 , 基本都是预免知渡有多少个字 , 字和字之前的间随惑求是忍人样的笛等一系列的信息之后 , 才可以
异动手分制、可是加果我万知渡这些信息肥 ? 我又执唐了 .

自动识别。非常不好痴思 , 我现在能做 OCR 基本只能词在切红阵殴 , 可以健英文和敦孙的 OCR, 而日还顾预兆知道它们的字体是
什么栾皋。要是任务中说 , 字余万定 , 邱对不起 , 又是 msson mposstble。

二、百度OCR接口（https://cloud.baidu.com/product/ocr）

1.pom文件引入


    com.baidu.aip
    java-sdk
    4.16.3

2.示例代码

// 设置APPID/AK/SK，百度开放平台申请
public static final String APP_ID = "xxx";
public static final String API_KEY = "xxx";
public static final String SECRET_KEY = "xxx";

public static void main(String[] args) {
	// 初始化一个AipOcr
	AipOcr client = new AipOcr(APP_ID, API_KEY, SECRET_KEY);

	// 可选：设置网络连接参数
	// client.setConnectionTimeoutInMillis(2000);
	// client.setSocketTimeoutInMillis(60000);

	// 可选：设置代理服务器地址, http和socket二选一，或者均不设置
	// client.setHttpProxy("proxy_host", proxy_port);  // 设置http代理
	// client.setSocketProxy("proxy_host", proxy_port);  // 设置socket代理

	// 可选：设置log4j日志输出格式，若不设置，则使用默认配置
	// 也可以直接通过jvm启动参数设置此环境变量
	// System.setProperty("aip.log4j.conf", "path/to/your/log4j.properties");

	// 传入可选参数调用接口
	HashMap options = new HashMap();
	options.put("detect_direction", "true");
	options.put("probability", "true");

	// 调用通用文字识别（高精度版）接口
	String path = "D:\\AipOcr\\test.png";
	JSONObject res = client.basicAccurateGeneral(path, options);
	System.out.println(res);
}

测试识别内容：

文字识别

多场景、多语种、高精度的文字检测与识别服务，多项ICDAR指标居世界第一；广泛适用于远程身份认证、财税报销、文档电子化等场景，为企业降本增效；提供稳定易用的在线API、离线SDK、软件部署包多种服务形式

测试识别结果：

[main] INFO com.baidu.aip.client.BaseClient - get access_token success. current state: STATE_AIP_AUTH_OK
{
"words_result": [
{
"probability": {
"average": 0.9998205304,
"min": 0.9995654225,
"variance": 3.399270554e-8
},
"words": "文字识别"
},
{
"probability": {
"average": 0.9861286879,
"min": 0.7947289348,
"variance": 0.001485200832
},
"words": "多场景、多语种、高精度的文字检测与识别服务，多项CDAR指标居世界第一；广泛适"
},
{
"probability": {
"average": 0.9937770367,
"min": 0.9039209485,
"variance": 0.0003865746548
},
"words": "用于远程身份认证、财税报销、文档电子化等场景，为企业降本增效；提供稳定易用的"
},
{
"probability": {
"average": 0.9717450142,
"min": 0.4633237422,
"variance": 0.01199602988
},
"words": "在线API、离线SDK、软件部署包多种服务形式"
}
],
"log_id": 1480825588763090000,
"words_result_num": 4,
"direction": 0
}

java OCR

java使用OCR

Tesseract Introduction

相关

JavaWeb的三大作用域

java中常用数组copy方法

6.Java方法

Java web开发：从零到 Run 一个现有的 Spring Boot 前后端分离项目（前端Vue）

javascript基础知识(29) 实现继承的方式

java 正则表达式

JAVA List<Object[]>取值问题

初次接触Java感受

99乘法表 java for循环

基于java.net.socket包的对象传递

Idea Java项目文件夹后面提示百分数怎么去掉

Java8新特性

标签