干货分享:怎样判断票据OCR识别产品的质量好坏?

易小识 2019.08.13 12:00:00

易道博识

大家对发票应该都不陌生

发票是在购销商品或提供服务中,根据费用的消耗情况,开具的收付款凭证,主要用于财务会计核算的原始凭证。

于企业,发票是公司做账的依据;于个人,发票是报销的凭证。日常接触报销工作的朋友和日常处理财务工作的会计人员,肯定都对发票报销这件事非常熟悉。

传统的人工录入方式,财务人员需要投入大量的人力成本和时间成本将发票录入系统,不仅运营成本昂贵,而且录入速度难以提升,错误率难以降低,业务时效提升困难,企业服务品质不佳。

在人工智能技术大行其道的当下,再使用手动录入票据就过时了。借助AI技术,通过OCR技术自动批量识别票据信息,提取重要的发票内容,直接对接到财务管理系统中,既能节省人力,提高劳动效率,又能减少错误率,节约成本,大幅提升报销体验。

不过如今市面上出现的诸多票据识别产品,识别效果参差不齐,要如何判断一个票据识别产品的识别的质量好坏呢?

这里可以给大家提供几条判断标准:

01 识别技术是传统OCR还是深度学习OCR

相比有着几十年发展历史的OCR技术来说,深度学习是个新兴事物。传统OCR的流程大都是

图像处理—二值化—版面分析—行切割—字切割—单字识别—后处理

2012年Imagenet竞赛采用深度学习技术的AlexNet夺得冠军,在图像视频领域深度学习方法开始大幅超越传统算法,基于此产生了新的基于深度学习的OCR识别技术。

深度学习OCR的识别流程与传统大有不同,流程基本可以简化为

多目标检测—整行识别—后处理

在复杂版式的文字识别上,深度学习OCR比传统OCR有着压倒性的技术优势。

不过市面上很多厂商会将传统OCR技术的产品宣传包装为深度学习OCR产品。如何区分?也有诀窍。

首先看识别模式。

传统OCR单字识别,深度学习OCR技术整行识别。这样说可能不够清晰,直白的说,由于传统OCR技术采用单字识别,很容易出现形近字误识的情况。而整行识别会关联前后语义进行联想,因此较少出现这种错误。

第二看识别流程。

传统OCR识别需要对图像进行二值化,转化为黑白两色,但这样会损失大量信息。深度学习OCR技术可以识别复杂背景图像,无需进行二值化。因此,对图像进行二值化的基本上就是传统OCR技术了。

第三看硬件需求。

深度学习OCR技术通常都需要GPU支持,而传统OCR使用的大多是CPU。

第四看图像要求。

如果OCR识别的图像要求一定是平整清晰格式标准的扫描件,那一定是传统OCR技术。深度学习技术具有强大的泛化能力,对图像质量要求很低。因此无论是扫描仪、高拍仪这种专业设备取图,还是手机平板等移动设备拍摄的图像,都可以达到不错的识别效果。

02 看识别率的高低

OCR技术的识别率有几种说法——单字识别率,字段识别率,整张识别率等。

单字识别率97%指的是平均每100个字里97个正确。

深度学习技术不进行单字识别,因此这个指标没有太大意义。取而代之的是字段识别率。例如在身份证识别的过程中,地址“XX省XX市XX街道XX号”这一串内容是一个字段,其中有一个字错误都算字段识别错误。

假设平均每个字段有6个单字,那么单字识别率97%的实际字段识别率只有

0.97×0.97×0.97×0.97×0.97×0.97≈0.833

只相当于字段识别率83.3%的产品,因此同等字段识别率的含金量远高于单字识别率。

再有一种标准是整张识别率。

一张增值税发票上含有几十个字段,严格地说,只有这些字段全部识别成功才能算作识别通过。其中任何一个字段识别出错都算错误。因此,整张识别率是一种非常严格的评价标准。

而易道博识的发票识别平均整张识别率在95%以上。据客户实测数据,最常用的增值税发票的整张识别率可以达到96.3%。

03 看识别速度的快慢

在实际业务场景中,识别速度和准确率都是需要衡量的重要标准,需要综合考虑。

准确率过低,校对工作量巨大,缺少实际应用价值。识别速度过慢,一来业务效率提升有限,二来用户体验不佳。尤其是大批量票据需要处理的时候,识别速度的快慢直接影响到业务的处理效率。

目前易道博识的票据识别产品,在标准硬件环境下,单张票据识别速度可以控制在1s内,而A4幅面多张票据混扫的是识别速度可以控制在3s内,精准且高效,非常适合大量票据批量处理。

04 能否自动分类

票据自动分类功能在实际应用中是一种非常有用的功能。我们日常报销涉及到的常用发票种类就有十几种,如果可以用通用接口识别所有票据,省去人工分类的过程,可以进一步简化业务流程,节约人力。

易道博识的票据识别产品可以通过表格分析、文字分析等实现版式匹配,从而完成自动分类,无需手动区分票据种类,可以统一识别,自动输出分类结果。

05 能否一次识别多张票据

多张票据一次识别也是一项非常有价值的附加功能。将不同种类的票据堆在一起拍摄,自带票据切分功能,可以一次性识别,还能自动分类输出结果,不仅可以减轻贴票负担,还能加快识别速度,让发票识别工作更轻松。

多张票据识别时存在诸多技术难点,不一定所有票据摆放都是横平竖直,实际操作中会存在一定的角度。这就对票据定位切分提出了很高的要求。有些厂商提供的票据混扫功能对于票据的摆放角度有严格要求,例如45°角的票据就很难识别。

但易道博识票据识别技术突破了角度限制,可以识别任意角度堆放的票据,不受规则限制,彻底解放发票报销工作。

易道博识

易道博识

易道博识

易道博识

易道博识

易道博识

综上,大家应该已经对如何判断市面上的票据OCR产品质量好坏有了初步认知。票据OCR产品众多,价格千差万别,但实际应用效果和价格不一定成正比。

相信大家既不希望用相对便宜的价格买到完全无法使用的产品,也不希望用过高的价格去买一般的产品。只有充分了解技术原理和盲点,才能不被市面上五花八门的宣传迷花了眼。

学会如何选择更优质的识别产品,才可以让人工智能技术体现真正的价值,帮助企业更好地实现降本增效。



标签:   票据识别 技术

相关推荐