编程开发 | 5.1M
语言:简体
5 .0
应用简介
借助jTessBoxEditor软件,可以提高Tesseract-OCR文本识别的准确性。通过jTessBoxEditor的不断训练,Tesseract-OCR文本识别的准确率得到了很大的提高。
借助jTessBoxEditor软件,可以提高Tesseract-OCR文本识别的准确性。通过jTessBoxEditor的不断训练,Tesseract-OCR文本识别的准确率得到了很大的提高。
指示
jTessBoxEditor的运行环境是JAVA虚拟机,是teeesseract智能图像识别软件的训练框架。无需安装,直接解压即可。不过必须提前安装一个jar包jdk-8u101-windows-x64虚拟机。
用jTessBoxEditor自动训练3500常用汉字
打开jTessBoxEditor图形界面
(1) 单击TIFF/BoxGenerator 按钮
(2)复制3500个汉字到空白处
(3)选择文件夹:(随便命名一个文件夹,我的是在F盘)
(4)命名(随意命名,比如我的是哈哈)
(5)选择自己的医学训练字体(比如我的是宋朝9pt)
(6)然后点击Generate按钮生成tif和box文件
(7) 单击训练器按钮
(8)打开之前创建的文件夹
(9)语言需要重命名(改成和步骤4一样的名字,我的是哈哈)
(10)选择已有箱的列车
(11)然后点击运行
(12)成功后:
热门攻略