科技时报 全球最新科技资讯专业发布平台

胡海飞的“智能化iOCR财务票据识别系统”研究报告获AIIA批准并正式立项

2019-04-15 17:27:34已围观次来源:科技网编辑:安然

    4月13日,中国人工智能产业发展联盟(AIIA)2019年第四次全体大会在北京召开,会上,BTL科技(深圳)有限公司财务科技负责人胡海飞组织撰写的《智能化iOCR财务票据识别系统》研究报告获得与会专家的认可,获AIIA批准并顺利通过立项。该报告是BTL联合中国人工智能产业发展联盟共同成立的“智能产品安全与评测联合实验室”的首个研究成果。

图片1.jpg

胡海飞

    OCR(OpticalCharacterRecognition)全称“光学字符识别”,即利用光学技术和计算机技术将印制或书写与纸张上的文字读取出来,并转换成计算机可读取、人可以理解的格式。作为实现文字高速录入的关键技术,OCR目前已广泛应用于财务、金融、交通、教育、泛互联网等多个领域。然而,不同应用场景中OCR数据类型差异化很大,每个应用场景都对OCR引擎有不同的要求。例如,金融和交通领域的OCR数据多是结构化的卡证类数据,如身份证、银行卡、驾驶证等,而卡证数据简单、场景安全性要求高,因此对OCR引擎的识别准确率要求会比较高;在教育、泛互联网领域中,多为算式、表格、广告图片、游戏图片等非结构化数据,对OCR引擎的识别准确率要求会相对较低。

    目前,业界尚未有统一的、标准化的OCR引擎评测方法,导致OCR应用市场鱼龙混杂,阻碍了OCR技术在不同领域的良性发展。

    基于领先的自定义模板文字识别技术,以及在多个行业里的AI应用实践经验,胡海飞AI团队启动了《智能化iOCR财务票据识别系统》研究报告(以下简称“研究报告”)的编纂工作,分析OCR在应用中的评测场景、样本分类及评测的关键指标。

图片2.jpg

(拓展矩阵搜索识别法与顺序、随机搜索识别法测试的比较),表来自胡海飞的《研究报告》

    按照不同的应用场景,《研究报告》将OCR引擎划分为“卡证类文字识别”、“票据单据识别”、“汽车相关识别”、“行业文档识别”和“通用文字识别”,基本覆盖主流的OCR应用场景。针对不同的OCR引擎,《研究报告》也建立了不同的标准评测样本集。

    对于评测的关键指标,《研究报告》将其划分为“效果指标”和“性能指标”两类。例如,针对身份证、行驶证等字段准确率要求高的场景,主要看字段级的效果指标,针对通用文字、行业文档等场景,主要看字符级的效果指标。

    胡海飞AI团队拥有以NLP自然语言处理为核心的智能文本处理能力矩阵,能够在丰富的场景下实现对各种文档文件的抽取、审核、比对等等,实现对文档的智能化处理。胡海飞将RPA与OCR、NLP等AI技术进行深度融合,以OCR作为RPA的“双眼”,以NLP作为RPA的“大脑”,大幅拓展RPA在财务领域的适用场景。

    iOCR具备机器学习能力,相较传统OCR具备非常强的泛化能力,能够通过学习识别新的票证和文件,并达到满意的识别准确率。智能RPA支持流程扩充以满足不断发展的业务需求。胡海飞自研的智能文档审核系统能够与财务共享平台互联互通,系统预置了数十种常见审核文档及风险审核规则,用户可根据业务场景定制风险审核项,支持基本数值逻辑运算。目前胡海飞AI团队智能文档审核系统功能已经覆盖90%以上的财务风险审核点。

    因此,与会专家认为,基于OCR应用领域的广泛性,分场景建立权威的评测标准,将有助于更快速地推进OCR技术的产业化落地。(杨雅玲)