网上有很多关于pos机风控未知返回码,离不开的风控返OCR的知识,也有很多人为大家解答关于pos机风控未知返回码的未知问题,今天乐刷官方代理商(www.zypos.cn)为大家整理了关于这方面的码离知识,让我们一起来看下吧!
1、不开pos机风控未知返回码
序言:
OCR(Optical Character Recognition,风控返光学字符识别),未知是码离指针对印刷体字符,采用光学方式将纸质文档中的不开文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的风控返文字转换成文本格式,供文字处理软件进一步编辑加工。未知
在金融机构信贷场景的码离风控流程中,尤其是不开线上信贷产品,无论是风控返面向C端个人,还是未知面向B端中小微企业,OCR技术是码离金融机构方在产品业务流程中经常采用的手段,可以应用于业务场景中的风控指标识别、用户信息认证、财务数据录入等环节,有效提高业务流程中数据信息获取与传输的效率。
现结合金融信贷领域的常见业务场景,介绍下OCR技术在个人、中小微企业信贷产品风控流程中的解析应用,如个人卡证识别、企业执照识别、征信报告识别、财务票据识别等。
一.身份证识别
当用户对线上信贷产品进行申请时,首先需要填写个人基本信息并上传身份证,而身份证信息的识别与获取,正是通过OCR方式实现,可以精准识别身份证正反两面的信息,并返回相关指标字段。如图1为身份证正反面样例,OCR识别后会生成对应的数据报文,部分样例如图2所示。
编辑
图1 身份证正反面样例
编辑切换为居中
图1 身份证正反面样例
编辑
图2 身份证OCR数据报文
编辑
图2 身份证OCR数据报文
从返回报文中解析提取出我们需要的字段,储存至数据库对应的用户基本信息表,具体指标如图3所示。
编辑
图3 身份证字段指标
根据用户的基本信息字段,可以进行相应风控流程的策略核验,或加工模型变量字段,现举几个例子进行说明:
将“姓名”和“身份证号”进行用户二要素核验认证(调用三方数据接口);验证身份证是否过期,将“失效日期”与当前日期进行比较;户籍“地址”是否符合产品开展业务面向的省市区域范围;由“出生”日期算出新字段“年龄”,核验是否满足年龄准入条件等。 二.银行卡识别在用户申请产品的流程中,银行卡信息也是必填内容之一,在很多线上信贷产品的业务流程中,银行卡信息的读取和存储,是通过用户上传银行卡照片,然后经OCR识别解析的。OCR可以对常见银行卡的卡号、有效期、发卡行、卡片类型等关键字进行识别,其样例如图4所示,OCR返回的部分数据报文如图5所示。编辑切换为居中
图4 银行卡样例
编辑
图5 银行卡OCR数据报文
从返回的银行卡数据报文中,可以解析提取出需要字段,具体指标如图6所示。
编辑
图6 银行卡字段指标
根据银行卡的解析字段,结合用户身份的基本信息,可以通过调用三方数据接口进行银行卡三要素实名认证(姓名、身份证号、银行卡号),或四要素核验实名认证(姓名、身份证号、银行卡号、手机预留号码),这些规则都是产品风控流程中的前置准入条件。
三.企业营业执照
对于中小微企业信贷产品,营业执照是必须提交的材料之一,在线上申请流程中,用户通过在平台上传企业营业执照,系统会进行OCR识别,解析其中必要字段存储到数据库中,然后应用到风控策略或模型的决策中。OCR可以结构化识别各种类型版式的营业执照,并返回企业名称、社会信用代码、地址、法人、类型、成立日期、有效期至、经营范围等关键字段信息。企业营业执照的样例如图7所示,OCR返回的部分数据报文如图8所示。
编辑
添加图片注释,不超过 140 字(可选)
图7 营业执照样例
编辑
图8 营业执照OCR数据报文
从返回的营业执照数据报文中,可以解析提取出详细字段,具体指标如图9所示。
编辑
图9 营业执照字段指标
根据营业执照的解析字段,我们可以将其应用到产品的风控流程中,现举几个例子进行说明:
将“企业名称”、“社会信用代码”进行企业二要素核验认证(调用企业三方数据接口,如企查查、启信宝等);将“企业名称”、“社会信用代码”、“法定代表人”进行企业三要素核验认证(调用企业三方数据接口);核验“有效期至”是否过期,当取值为“长期”时则直接有效,当取值为日期时,则与当前日期进行比较;通过“成立日期”与“当前日期”取差值,加工新字段“经营年限”,验证是否符合产品关于企业年限的准入条件;企业“地址”取“省市”字段,验证是否符合产品关于地域范围的准入条件;“注册资本”、“经营年限”等字段可以在企业评分模型中进行应用。四.人行征信报告
在金融信贷领域中,对于个人端或中小微企业端信贷产品,人行征信数据是风控体系中特别重要的数据维度,人行征信报告的数据信息可以真实地反映出客户的基本信息和风险信息。因此,很多金融机构对申请用户的风险评估,很依赖人行征信报告的获取与解析。随着OCR应用场景的不断成熟与扩展,现在很多金融机构采用线上解析个人或企业的人行征信报报告。
对于人行二代征信报告,具体结构化信息包括个人基本信息、信息概要、信贷交易信息明细、公共信息明细、查询记录等。通过OCR对人行征信报告进行解析,可以实现以上各个模块信息的识别。人行征信报告样例如图10 所示,图中右侧为通过OCR系统生成的结构化文本,可以很清晰的展示出相关指标。同时,返回的数据报文部分样例如图11-14所示。
编辑切换为居中
图10 人行征信报告样例
编辑切换为居中
图11 征信报告OCR数据报文-基本信息
通过OCR返回的基本信息相关字段有多个指标,包括姓名、身份证号码、性别、出生日期、婚姻状况、手机号码、学历、学位、通讯地址、户籍地址、国籍、就业状况、电子邮箱、工作单位等,涵盖了用户比较全面的基本信息特征。对于比较重要的字段,如姓名、身份证号码等,在风控流程的策略规则模块中,可以将这些指标与前边用户填写或上传身份证解析的同含义字段进行再次核验。例如,比较身份证的“姓名”和人行征信报告的“姓名”是否一致,这样可以进一步验证材料的真实性。同时,很多字段都可以进一步加工成策略规则应用于风控前置规则中,比如年龄与学历是否相符、工作单位与通讯地址是否符合逻辑、身份证号码与户籍地址是否匹配等。
编辑切换为居中
图12 征信报告OCR数据报文-信贷交易
编辑切换为居中
图13 征信报告OCR数据报文-逾期信息
编辑切换为居中
图14 征信报告OCR数据报文-查询记录
图12-14是通过OCR返回的信贷交易、逾期信息、查询记录等信息,这些维度的字段信息价值很高,无论在策略规则的制定,还是在风控模型的开发,很多指标的区分度表现较好,比如逾期机构数、逾期金额、逾期天数等,可以很好的反映出客户的信用风险程度。
在风控策略规则的应用中,通过OCR返回的征信报告某些字段,可以直接用于规则决策,比如当用户近6个月逾期机构数大于某个值,或近12个月逾期天数大于某个值时,可以直接将其拒绝。在数据建模过程中,如A卡申请模型、B卡行为模型、C卡催收模型等,以上信贷交易或查询信息的特征指标,对模型拟合效果的贡献度也会表现较好。同时,对于OCR返回的征信基本字段中,可以进一步衍生加工新的指标,这样可以扩大特征变量范围,为策略制定或模型开发提供更多的特征选择。
五.小结
在信贷场景的产品业务流程中,OCR解析已经成为金融机构方在客户申请环节获取数据信息的一种常用方式。OCR通过文本识别返回数据指标的过程,可以很大程度上提高业务流程的审批效率,对于风控体系的指标获取、策略应用等环节提供了较为便利的方法与途径。
对于OCR在信贷风控流程中的应用,除了以上介绍的身份证、银行卡、企业营业执照、人行征信报告这几种常见情况,还有其他应用场景,比如财务报表识别、发票识别、房产证识别、驾驶证识别等。虽然解析过程原理一样,但应用场景都有所区别,比如在中小微企业信用贷、物流金融、房抵贷等业务类型。
对于本文介绍的OCR解析人行征信报告内容,由于报告包含的内容较多,对应解析出各个维度的字段也比较多,因此另外提供了通过OCR解析返回的人行征信报告的详细数据报文,具体附件请参考本次我们上传到知识星球上的附件。
编辑切换为居中
添加图片注释,不超过 140 字(可选)
编辑切换为居中
添加图片注释,不超过 140 字(可选)
~原创文章
...
end
以上就是关于pos机风控未知返回码,离不开的OCR的知识,后面我们会继续为大家整理关于pos机风控未知返回码的知识,希望能够帮助到大家!
相关文章: