人工智能有哪些落地应用?

易小识 2019.08.16 12:00:00

人工智能细分领域很多,比如计算机视觉,机器学习,语音识别,自然语言处理,智能机器人,自动驾驶等等。

术业有专攻,作为一家专注做OCR识别的人工智能公司,今天来跟大家聊一下OCR技术的落地应用有哪些场景。


首先简要介绍一下OCR技术。

OCR识别技术属于计算机视觉领域,是Optical Character Recognition的简称,直译是光学字符识别,直观理解就是把纸张、卡证、车牌之类的载体上的文字通过光学手段和技术手段翻译成计算机可以使用的电子化数据的过程。

要把电脑中的文字变成不可编辑的图像很简单,截图,拍照,转pdf都可以做到。

但要将图像中的文字形状转化为可编辑的数据,这个过程比我们大多数人的想象可能会更复杂一些。


在银行、保险、证券为代表的金融领域以及政府、医疗、司法、档案管理等等诸多领域中,存在着大量的需要把卡证、牌照、票据、表单、合同以及其他纸质文档录入的需求。

而早先我们解决这种需求的办法是——人工录入

有一种叫【打字员】的职业,曾经就是干这种把文字录入电脑的工作。

不过现在这个职业已经成功“转型”为专业诈骗了。

嗯,也许说现在招聘打字员工作百分百都是诈骗也有点绝对,那我们严谨一点,用@江宁公安在线 的话来说:


易道博识


第一个原因是——现在的年轻人里,想找几个不会敲键盘打字的都难(感谢我们国家基础教育的普及和个人电脑智能手机的推广)。

第二个原因则是——将图像转文字的OCR技术已经很成熟。收费的OCR识别按页收费,千字成本顶多一两毛,录入准确率不比人手打要低,而人工成本千字少的说要给三五块,有的说能给十几块甚至更多,小说网站上的原创作者都不一定能拿这么多。大量文字录入的工作不考虑用OCR,还非要人手打,不是蠢就是骗子。


现在在市面上你可以找到不少免费的识别软件,哪怕识别率稍微低一点,也是可以将就用的。而企业所需要的专业OCR识别产品更是已经非常成熟,录入准确率甚至已经超过人工录入。大批量使用OCR的场景购买专业识别产品,准确率高,速度快,价格也不贵。干嘛还要人工来录呢?

不过说实在的,哪怕这项技术已经非常成熟,距离真正大规模应用,在各行各业都发挥出应有的功能,还是需要很长时间的。

大家可以想想,在自己的工作和日常生活中,是不是仍然存在很多情况需要手动去敲一串很长的卡证号码,或者手动录入一大段纸质文档中的文字。

哪怕已经到了2019年,北京的连锁便利店里还能看到有收银员是要靠手动把产品条码输进系统的,就连条码识别的技术都没有百分百普及,更何况文字识别?


我们回过头来接着讲OCR的落地应用,以我们公司为例,重点着眼的领域是金融——

易道博识的创始团队是几位来自于中科院、清华大学、北京大学的人工智能专家,为了把他们在视觉识别领域的技术成果转化为商业应用,易道博识在经过一段时间的探索后把方向瞄准了金融领域。

不是说其他领域的OCR识别需求不多,事实上像在档案管理、医疗、司法卷宗还有一些政府工作中,需要录入的东西只多不少。

但是金融领域对新技术的包容性是最强的。金融对低成本和高效率的极致追求使得它们“敢为天下先”,除了天生根植在新兴技术里的互联网行业,金融行业往往是最先能够接纳前沿技术的领域。

而OCR识别技术,又恰好戳中了金融行业迫切需要解决的一个痛点。


OCR识别能做什么?

1.远程开户

易道博识在金融领域最早的尝试,是推广卡证识别开户方案。

没错,当你在银行证券等APP上开户绑卡的时候,拿手机摄像头扫描一下你的身份证和银行卡就能录入系统,不需要再手动输入姓名号码,这就是人工智能OCR技术落地应用的实例。

易道博识的视频流识别技术甚至不需要点击拍照识别或者上传,只要把身份证在摄像头前放一下,银行卡号对准扫描线晃一下,就能自动识别录入。


易道博识
由于识别速度太快,为了这个画面截了N次图




易道博识
识别结果还是非常OK的,没有受到花里胡哨的背景影响


后来为了配合实名制的身份验证需求,又加入了人脸识别的功能。

卡证+人脸识别完成远程开户,现在绝大多数的银行、证券之类的金融APP应该都有了这项功能,过于普及以至于可能很多人都没把它当做人工智能技术。


2.表单票据录入

在银行最怕的是什么?

排队。

明明自己几分钟就能办好的业务,交个号排一两个小时都是有可能的。

但是柜员小哥哥小姐姐明明在一刻也不停的工作呀,一个接待完了马上接下一个号。那么这么长的时间里,他们在干什么呢?


办理业务的人把一大堆材料递进去,里面的人把需要的信息一个字一个字敲进电脑。

早些年汉字输入法还在智能ABC阶段的时候,银行柜员甚至还要求要学五笔打字,一快二准。现在拼音输入的速度有了很大提升,生僻字录入也方便了很多,对五笔的要求才逐渐放宽,不是必修科目了。

当银行柜员虽然不需要职业电竞选手的手速,但是打字速度起码也要在一分钟三五十字左右,快的甚至能到100字,特别是数字小键盘要用的特别6。

可能很多人觉得这也不是什么高要求,但是银行证券等等金融行业的入门门槛越来越高,985硕士进了银行先去做柜员,每天在小键盘上敲一串串无意义的数字,这样的工作能带来多少价值呢?


而现在,使用OCR技术可以省去绝大多数文字录入的繁琐工作。目前在银行证券保险等行业中,除了身份证、护照、户口本、军官证、港澳通行证这些身份证件和银行卡以外,使用比较多的有营业执照、开户许可证、行驶证、驾驶证、支票、汇票、机动车销售发票,不动产登记证等等的识别。

引入这些OCR识别产品可以省去业务录入的时间,原来需要三五分钟才能完成的工作可以缩减到几秒钟,大大提升业务效率。

3.发票识别

财务会计也是一个录入工作非常多的岗位,每天要和大量的数字打交道,一家大型企业的财务部门每天都要处理成千上万张票据。

众所周知,在感性思维上人工智能还远远比不上人类,但是在纯粹的运算处理和数据工作上,机器的效率可是要远远超过人类的。

而财务这样一个需要大量处理数字的岗位,也是OCR技术的一个大舞台。

简单的说,人工智能在这里扮演的角色就是一个帮你把票据自动录入系统并且进行验真和自动审核的功能。

这个录入功能到底有多强大?

易道博识


这样一张A4大小(其实更大)的幅面的票据图像进行识别,3秒内可以完成自动分类、切割、定位、识别和结构化输出,直接对接到系统,而且可以做到票面全字段识别,自定义所需要的字段,不会舍弃任何有潜在使用价值的数据。

你要是觉得把票据这样摆得整整齐齐浪费时间,也可以选择简单粗暴模式

易道博识
(摆个票都是爱你的形状)


易道博识


发票类型不一样,方向不一致,票据有交叠,这些都没关系。只要不遮盖关键信息,怎样摆都可以。


易道博识
哪怕你摆出个花,一样可以精准定位。


易道博识
截图来自易道博识票据识别APP“慧报销”实际识别页面

这套识别平台目前已经在某些大型集团的集中运营中心落地使用了,财务更大程度地向自动化智能化转型,运营成本压缩的同时,效率也有明显提升。越是票据处理工作量大的企业,这套平台的价值也越明显。


综上,是OCR技术在泛金融领域几个比较典型的落地应用场景,有些是大家熟悉的,有些是刚刚开始试点推广的,但从实际效果来看,都有切实的应用价值,真正提升了用户的使用体验,提高了企业的工作效率,还节约了不少人力成本。

我们也期望这一项技术之后能在各行各业普及,让大家日常的工作更轻松,哪怕一点点,都是科技发展的价值所在。

最后贴个链接:易道博识AI开放平台-优质的人工智能服务平台

当前已经上线的识别产品有这些,可以在线试用效果。


易道博识

还有一些例如财务报表之类的识别产品还没有上架,如果有类似识别需要可以官网上获取联系方式咨询。



标签:   解决方案 识别产品

相关推荐