文字识别
表格识别
印章识别
勾选识别
签名比对
印刷、手写、中文、英文、数字识别
基于深度学习全新DeepOCR识别流程,大幅提升识别速度及精度,
卡证类< 300ms,单张发票< 1s,A4幅面票据混扫< 3s,
汉字字符识别率> 99.5%,数字字符识别率> 99.9%,
英文字符识别率> 99.7%,手写整行识别率> 95.2%
有线、无线、列位偏移、多列重叠
多形状、多方向、曲线行、模糊、遮挡
重叠 、小印章
符号检测、内容识别
签名检测、签名比对
版面分析:标题、段落、表格、印章、签名、信息块、图表
文档分类:固定格式、非固定格式、富格式文档、长文本文档
文档抽取:实体、关系、表格、印章、签名
文档比对:关键信息、段落、表格、结构
图像检测、图像分割
图像质检:模糊、反光、拍屏、水印、复印、篡改、变形、切边、远距离、遮挡
噪声和干扰去除:图像噪声、水印、阴影、印章、痕迹去除
文本分析:分词、词向量表示、依存句法分析、命名体识别、文本相似度
语言理解:文本分类、信息抽取、情感分析
依托GPT、BERT等大规模语言模型,基于海量文本语料自动学习,具备更好的文本理解和文本生成能力。
基于LayoutLM、ERNIE等大规模文档版式预训练模型,利用大量文档样本自监督学习,更好地理解各种文档结构、内容和语义。
以大规模语言模型和版式预训练模型为基础结合领域数据,通过下游任务学习,快速生成领域中小规模模型,并输出场景AI能力。
针对本地化、私有化等生产部署场景,利用知识蒸馏等模型轻量化技术,解决算力局限性问题实现业务场景深度融合。