您当前的位置:首页 > 技术文章

三款OCR文字识别软件评测

时间:2021-07-06 17:42:13

      日常工作中,我们经常会遇到需要将一张图片或者扫描文档中的长篇文字转换为文字的情况,这时我们就需要使用到OCR识别软件。
      OCR软件可以帮助我们解决一些图片有关的问题,比如说可以进行图片文字识别、图片转文字、语音转文字等等,简单的来说,就是把图片上的文字转换到文档中去。这样就极大提高了我们的办公效率。
      三人行免费资源网在众多的OCR软件里面精挑细选了三款国产OCR软件,进行了对比评测,推荐给大家使用,希望能够为你的日常办公助一臂之力。
 
  PandaOCR
      PandaOCR具备了识别文本、翻译文本等强悍功能,PandaOCR软件的识别引擎分别是百度OCR+有道OCR+TXOCR+搜狗OCR,并且软件操作简单,能够帮您方便快速查看识别/翻译内容。
 
  濠通屏幕识别
      本软件最大的创新在于它超便捷的操作方式。用户可以像使用 QQ 截图一样极为便利地选取屏幕上一块区域进行文字识别,摆脱了老式文字识别软件的臃肿、繁琐,真正将文字识别带入日常使用之中,可以自由发挥灵活多变的使用方法。
      软件使用百度文字识别引擎,识别速度快、准确度高。同时包含多种识别模式。除了普通的文字,还可以识别身份证、驾驶证、营业执照、银行卡、车牌号等多种证件。
      除此之外,还增加了扫码功能,能够识别条形码、二维码等多种类条码。
 
  千百OCR
       1. 对繁体竖排文字识别额外优化添加便利功能,可高效准确识别竖排繁体文字。
  2. 体积小巧,使用方便快捷。支持屏幕截图,载入图片文件,载入pdf文件等来源方式。
  3.支持批量识别。
  4.识别速度快。大图片也能实现秒级识别。
  5.识别准确率高,并提供高精度识别功能。
  6.能识别质量低下的图片文本,比如早期的扫描版pdf,古籍古书等的识别。
  7.能将PDF整书按比例缩放后转换为每页一张jpg图片。
       8.繁体竖排可以在识别后同屏校对。
 
 
      三种OCR中文识别效果对比
 
      这里以PDF版本的出师表为例,测试三种OCR识别的准确率以及速度。
 
图一  测试素材《前出师表》
 
 
     首先测试panda OCR,结果如下:

 
 
图二 panda OCR识别结果界面
 
      panda OCR截图内容《前出师表》文字识别正确率100%,标点符号识别正确率100%。
      出师表标题前面的特殊字符识别错误,符号数量上没有丢失现象。
 
 
接下来测试濠通屏幕识文。选择高精度模式识别,结果如下:
 
图三 濠通屏幕识文 识别结果界面
 
      濠通屏幕识文截图内容《前出师表》文字识别正确率100%,标点符号识别正确率100%。
      出师表标题前面的特殊字符能正确识别,但是四位符号里丢失两位。
 
 
      最后测试千百OCR,结果如下:
 
图四 千百OCR 识别结果界面
 
      千百OCR截图内容《前出师表》文字识别正确率100%,标点符号识别正确率99%,每段最后的句号有丢失现象。出师表标题前面的特殊字符能正确识别,但是四位符号里丢失三位。
   三种OCR英文识别效果对比
 
      这里以一个英文软件网站为例,截图圈出一段英文,测试三种OCR识别的准确率以及速度。
 
图五  测试素材 英文段落截图
 
      首先测试panda OCR,结果如下:
 
图六 panda OCR识别结果界面

      panda OCR截图内容英文文字识别正确率100%,可以英译中,翻译很流畅。
 
      接下来测试濠通屏幕识文。选择高精度模式识别,结果如下。
 
图七 濠通屏幕识文 识别结果界面
      濠通屏幕识文截图内容文字识别正确率100%,标点识别率低,所有标点符号都默认成“.”濠通屏幕识文无法翻译。
最后测试千百OCR,结果如下:
 
图八 千百OCR 识别结果界面

      千百OCR截图内容文字识别正确率100%,可以翻译,翻译内容流畅度一般。
总结:
      文字部分:三款OCR文字识别率全都是100%正确率。没有文字丢失现象。
 
      标点字符:pandaOCR和濠通屏幕识文都是100%正确率,没有符号丢失现象。
                       千百OCR识别正确率100%,但文章每自然段最后的句号都有丢失。

      特殊字符:panda OCR识别特殊字符出错,特殊字符数量没有丢失。
                       濠通屏幕识文能正确识别特殊字符,但是特殊字符有丢失现象,四位字符丢失两位。
                       千百 OCR能正确识别特殊字符,但是特殊字符有丢失现象,四位字符丢失三位。

       翻译功能:pandaOCR可翻译且翻译的文字很准确。濠通屏幕识文没有翻译功能。千百OCR可翻译,但是翻译流畅度一般。
 
 
      三款OCR做对比结果,在没有特殊字符的情况下,panda OCR正确率最高且没有任何丢失。濠通屏幕识文和千百 OCR可以识别特殊字符,但是都有丢失现象。

      综合比较pandaOCR>濠通屏幕识文>千百 OCR,我们推荐您使用pandaOCR软件。以上三款软件我们都在三人行免费资源网提供,您只需百度一下三人行免费资源网就可以找到网址去下载,里面很多款好用的工具都在不停的更新中。